温馨提示×

python中dropna函数的用法是什么

小亿
307
2023-12-06 17:49:23
栏目: 编程语言

在Python中,dropna()函数用于删除包含缺失值的行或列。它可以应用于Pandas的DataFrame和Series对象。

当应用于DataFrame时,dropna()函数将删除包含任何缺失值的行或列,默认情况下,它将删除包含任何NaN值的行。但是,您可以通过指定参数来自定义删除缺失值的方式。

当应用于Series时,dropna()函数将删除包含缺失值的元素。

下面是dropna()函数的常用参数:

  • axis:指定删除行还是列。默认为0(删除行)。如果设定为1,则删除列。
  • how:指定删除的方式。可选的值有{‘any’, ‘all’}。默认为’any’,表示只要存在一个缺失值就删除,'all’表示只删除全部为缺失值的行/列。
  • subset:指定在哪些列或行中删除缺失值。可以是一个标签列表或一个包含标签的字典。
  • inplace:指定是否在原始数据上进行操作,默认为False,表示返回一个新的对象。

下面是dropna()函数的几个示例:

import pandas as pd

# 创建一个包含缺失值的DataFrame
data = {'A': [1, 2, np.nan], 'B': [4, np.nan, 6], 'C': [np.nan, 8, 9]}
df = pd.DataFrame(data)

# 删除包含缺失值的行
df.dropna()

# 删除包含缺失值的列
df.dropna(axis=1)

# 只删除全部为缺失值的行
df.dropna(how='all')

# 只删除指定列中包含缺失值的行
df.dropna(subset=['A', 'B'])

# 在原始数据上进行操作,而不返回新的对象
df.dropna(inplace=True)

0