dropna()
和notnull()
是pandas库中用于处理缺失值的函数,它们的用法和功能有一些区别。
dropna()
是pandas库中DataFrame和Series对象的一个方法,用于删除含有缺失值的行或列。它的主要功能是过滤掉包含缺失值的行或列,返回一个新的DataFrame或Series对象。默认情况下,dropna()
会删除包含任何缺失值的行或列,也可以通过参数指定删除方式。例如,可以通过设置axis
参数为1来删除包含缺失值的列,通过设置subset
参数来指定删除含有缺失值的特定列。
示例代码:
import pandas as pd
# 创建一个包含缺失值的DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4],
'B': [5, None, 7, 8]})
# 使用dropna()删除含有缺失值的行
df_dropna = df.dropna()
print(df_dropna)
输出结果:
A B
0 1.0 5.0
3 4.0 8.0
notnull()
是pandas库中DataFrame和Series对象的一个方法,用于判断每个元素是否为非空值。它返回一个布尔值的DataFrame或Series,其中为非空值的元素对应的位置为True
,否则为False
。
示例代码:
import pandas as pd
# 创建一个包含缺失值的DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4],
'B': [5, None, 7, 8]})
# 使用notnull()判断每个元素是否为非空值
df_notnull = df.notnull()
print(df_notnull)
输出结果:
A B
0 True True
1 True False
2 False True
3 True True
总结一下,dropna()
主要用于删除含有缺失值的行或列,而notnull()
主要用于判断每个元素是否为非空值。