在Pandas中,iloc
用于基于整数索引的行/列筛选,而多条件筛选通常使用布尔索引或query
方法
首先,我们创建一个示例DataFrame:
import pandas as pd
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data)
# 筛选条件:A列的值大于2,B列的值小于40
condition1 = df['A'] > 2
condition2 = df['B'] < 40
# 使用布尔索引进行筛选
result = df[condition1 & condition2]
print(result)
query
方法# 筛选条件:A列的值大于2,B列的值小于40
result = df.query('A > 2 and B < 40')
print(result)
这两种方法都可以实现多条件筛选。如果你需要对结果进行进一步的操作,例如计算某列的和,可以在筛选后的DataFrame上进行操作:
sum_of_column_c = result['C'].sum()
print(sum_of_column_c)
在大多数情况下,这两种方法的性能相差不大。但是,当处理大型数据集时,query
方法可能会更快,因为它在底层使用了NumExpr库进行加速。然而,这取决于具体的使用场景和数据类型,所以在实际应用中,建议根据实际情况进行测试和选择。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。