在Python中,dropna()
和notnull()
是Pandas库中的两个常用函数。
dropna()
函数用于删除包含缺失值(NaN)的行或列。它的常用参数包括axis
(指定删除行还是列,默认为行)、subset
(指定删除时考虑的列,默认为全部列)、how
(指定删除方式,包括any
和all
,默认为any
)、thresh
(指定每行或每列至少包含的非缺失值数量)。下面是一个使用dropna()
函数删除包含缺失值的行的例子:
import pandas as pd
data = {'A': [1, 2, np.nan, 4],
'B': [5, np.nan, np.nan, 8],
'C': [np.nan, 10, 11, 12]}
df = pd.DataFrame(data)
df.dropna(axis=0, inplace=True) # 删除包含缺失值的行
notnull()
函数用于判断每个元素是否为非缺失值(即不是NaN)。它返回一个布尔值的DataFrame,其中True表示非缺失值,False表示缺失值。下面是一个使用notnull()
函数判断DataFrame中每个元素是否为非缺失值的例子:
import pandas as pd
data = {'A': [1, 2, np.nan, 4],
'B': [5, np.nan, np.nan, 8],
'C': [np.nan, 10, 11, 12]}
df = pd.DataFrame(data)
not_null_df = df.notnull() # 判断每个元素是否为非缺失值
希望对你有帮助!