在Python中,可以使用groupby()
函数和sum()
函数对多列进行分组求和。
首先,需要导入pandas
库:
import pandas as pd
然后,创建一个包含多列的数据集,并对这些列进行分组求和。假设我们有一个名为data
的数据集,其中包含’列1’、'列2’和’列3’这三列:
data = {'列1': [1, 2, 3, 1, 2, 3],
'列2': [4, 5, 6, 4, 5, 6],
'列3': [7, 8, 9, 7, 8, 9]}
df = pd.DataFrame(data)
接下来,使用groupby()
函数将数据集按照指定的列进行分组,并使用sum()
函数计算每个分组的和:
grouped = df.groupby(['列1', '列2']).sum()
这将得到一个以’列1’和’列2’为索引的新数据集,其中包含每个分组的和。
如果只想对某一列进行求和,可以按照以下方式进行操作:
sum_column = df['列1'].groupby(df['列2']).sum()
这将得到一个以’列2’为索引的新数据集,其中包含’列1’按照’列2’分组后的求和结果。