【Python办公自动化】pandas库基础--筛选数据

发布网友 发布时间:2024-09-27 07:59

我来回答

1个回答

热心网友 时间:4分钟前

在日常的数据处理中,如何高效地筛选出所需信息是常见的需求。pandas库为此提供了强大的工具。首先,通过`pd.read_excel`函数读取数据时,你得到的其实是一个DataFrame对象,它承载了你想要的部分数据。

在筛选数据时,df对象的作用尤为关键。例如,如果你想获取某一列,可以直接使用`df['列名']`,如`df['name']`,这将返回该列的所有数据。要获取多列,可以用逗号分隔,如`df['id','name']`。

对于单行数据,虽然没有行名,但可以通过行索引来获取,例如`df[df.index=='行号']`。此外,也可以通过行号范围获取多行,如`df[0:2]`。关于切片,我们会不断遇到并深入理解。

如果需要特定行和列的数据,可以结合使用`loc`和`iloc`,如`df.loc[行号, '列名']`。通过条件筛选综合数据时,可以使用布尔表达式,如`df[df['name']=='特定值']`,或者组合多个条件,如`df[(df['id']==值1)|(df['name']=='值2')]`。

总的来说,pandas库的筛选功能强大而直观,能让你快速定位和处理数据。在后续的实践中,我们会进一步探索和应用这些技巧。下期,我们将把这些知识应用到实际案例中,期待你的参与!

下面是本期代码示例,每种筛选方法的实例都在最后一行有所改变:

python
import xlwings as xw
import pandas as pd
pd.set_option('display.unicode.east_asian_width',True)
file_path0='d:\\pandas\\test.xlsx'
df = pd.read_excel(file_path0,sheet_name=0,usecols=[0,1])
print(df[(df['id']==1)|(df['name']=='Smith')])
# 下期案例代码将基于此进行综合练习

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com