在Python中,reindex()
是一个常用的pandas方法,用于重新索引DataFrame或Series。这个方法允许你更改数据的顺序,从而使得索引值与新的索引标签匹配。以下是使用reindex()
方法的一些示例:
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
index = ['row1', 'row2', 'row3']
df = pd.DataFrame(data, index=index)
print("Original DataFrame:")
print(df)
输出:
Original DataFrame:
A B
row1 1 4
row2 2 5
row3 3 6
reindex()
方法重新索引DataFrame:new_index = ['row1', 'row3', 'row2']
df_reindexed = df.reindex(new_index)
print("Reindexed DataFrame:")
print(df_reindexed)
输出:
Reindexed DataFrame:
A B
row1 1 4
row3 3 6
row2 2 5
在这个例子中,我们使用reindex()
方法将DataFrame的索引从['row1', 'row2', 'row3']
更改为['row1', 'row3', 'row2']
。请注意,新的索引中包含了原始索引中的所有值,但顺序不同。
fill_value
参数填充缺失值:new_index = ['row1', 'row4', 'row2']
df_reindexed = df.reindex(new_index, fill_value=0)
print("Reindexed DataFrame with fill value:")
print(df_reindexed)
输出:
Reindexed DataFrame with fill value:
A B
row1 1 4
row4 0 0
row2 2 5
在这个例子中,我们使用fill_value
参数将新索引中不存在的值(即’row4’)替换为0。
总之,reindex()
方法允许你轻松地重新索引DataFrame或Series,并根据需要填充缺失值。