你可以使用pandas库中的groupby函数来按某一列拆分数据。
以下是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {
'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick', 'John'],
'Age': [20, 25, 30, 35, 40, 45],
'City': ['New York', 'London', 'Paris', 'New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
# 按照City列拆分数据
grouped = df.groupby('City')
# 遍历每个分组
for city, group in grouped:
print(city)
print(group)
print()
输出结果:
London
Name Age City
1 Nick 25 London
4 Nick 40 London
New York
Name Age City
0 Tom 20 New York
3 Tom 35 New York
Paris
Name Age City
2 John 30 Paris
5 John 45 Paris
以上示例代码中,我们创建了一个包含姓名(Name)、年龄(Age)、城市(City)的数据集,并按照城市(City)列进行拆分。然后,使用groupby函数进行分组,遍历每个分组并打印出来。
你可以根据需要对每个分组进行其他操作,例如计算统计量、应用自定义函数等。