温馨提示×

聊聊python dropna()和notnull()的用法区别

小云
100
2023-08-16 13:28:49
栏目: 编程语言

dropna()notnull()是pandas库中用于处理缺失值的函数,它们的用法和功能有一些区别。

dropna()是pandas库中DataFrame和Series对象的一个方法,用于删除含有缺失值的行或列。它的主要功能是过滤掉包含缺失值的行或列,返回一个新的DataFrame或Series对象。默认情况下,dropna()会删除包含任何缺失值的行或列,也可以通过参数指定删除方式。例如,可以通过设置axis参数为1来删除包含缺失值的列,通过设置subset参数来指定删除含有缺失值的特定列。

示例代码:

import pandas as pd
# 创建一个包含缺失值的DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4],
'B': [5, None, 7, 8]})
# 使用dropna()删除含有缺失值的行
df_dropna = df.dropna()
print(df_dropna)

输出结果:

A    B
0  1.0  5.0
3  4.0  8.0

notnull()是pandas库中DataFrame和Series对象的一个方法,用于判断每个元素是否为非空值。它返回一个布尔值的DataFrame或Series,其中为非空值的元素对应的位置为True,否则为False

示例代码:

import pandas as pd
# 创建一个包含缺失值的DataFrame
df = pd.DataFrame({'A': [1, 2, None, 4],
'B': [5, None, 7, 8]})
# 使用notnull()判断每个元素是否为非空值
df_notnull = df.notnull()
print(df_notnull)

输出结果:

A      B
0   True   True
1   True  False
2  False   True
3   True   True

总结一下,dropna()主要用于删除含有缺失值的行或列,而notnull()主要用于判断每个元素是否为非空值。

0