fillna()
是 pandas 库中 DataFrame 和 Series 对象的一个方法,用于填充缺失值(NaN)
value
:用于替换缺失值的值。可以是一个数字、字符串或者一个方法(如平均值、众数等)。method
:用于填充缺失值的方法。可选值包括 ‘pad’/‘ffill’(前向填充,使用前一个值填充缺失值),‘backfill’/‘bfill’(后向填充,使用后一个值填充缺失值)。axis
:指定要填充的轴。默认为 None,表示沿着 DataFrame 的每一列进行填充。如果设置为 0,则沿着每一行进行填充;如果设置为 1,则沿着每一列进行填充。inplace
:布尔值,表示是否在原 DataFrame 上进行修改。默认为 False,表示返回一个新的 DataFrame,而不修改原始 DataFrame。如果设置为 True,则会直接修改原始 DataFrame。limit
:指定连续填充的最大值。当设置为一个正整数时,表示最多填充指定数量的连续缺失值。例如,如果设置为 2,那么只有连续的两个缺失值会被填充,超过两个的缺失值将保持不变。downcast
:指定是否将填充后的数据类型降级。默认为 None,表示不进行降级。可以设置为 ‘infer’,表示根据填充后的数据自动推断合适的数据类型。下面是一个使用 fillna()
方法的示例:
import pandas as pd
import numpy as np
# 创建一个包含缺失值的 DataFrame
data = {'A': [1, 2, np.nan], 'B': [np.nan, 2, 3]}
df = pd.DataFrame(data)
# 使用 fillna() 方法填充缺失值
filled_df = df.fillna(method='ffill', axis=1)
print(filled_df)
输出结果:
A B
0 1.0 1.0
1 2.0 2.0
2 NaN 3.0