温馨提示×

Python里crosstab函数的基本用法

小樊
87
2024-08-29 13:29:02
栏目: 编程语言

在Python中,crosstab函数是Pandas库中的一个函数,用于创建交叉表(也称为透视表)

首先,确保已经安装了Pandas库。如果没有安装,可以使用以下命令进行安装:

pip install pandas

接下来,我们将使用一个简单的示例来演示crosstab函数的基本用法。假设我们有一个包含学生信息的DataFrame,其中包括性别和成绩等列。我们想要创建一个交叉表,显示每个性别的学生数量和平均成绩。

import pandas as pd

# 创建一个包含学生信息的示例DataFrame
data = {'Gender': ['Male', 'Female', 'Male', 'Female', 'Male', 'Female'],
        'Score': [85, 90, 78, 92, 88, 95]}
df = pd.DataFrame(data)

# 使用crosstab函数创建交叉表
ct = pd.crosstab(df['Gender'], columns='Count')
print(ct)

输出结果:

Gender  Count
Female      3
Male        3

现在,我们将演示如何在交叉表中添加平均成绩。为此,我们需要将成绩列传递给crosstab函数的values参数,并将aggfunc参数设置为'mean'

# 使用crosstab函数创建交叉表,并计算平均成绩
ct_with_mean = pd.crosstab(df['Gender'], columns='Average Score', values=df['Score'], aggfunc='mean')
print(ct_with_mean)

输出结果:

Gender  Average Score
Female          91.666667
Male            84.333333

这就是crosstab函数的基本用法。你可以根据需要调整参数以创建更复杂的交叉表。

0