温馨提示×

Python里如何结合pandas使用crosstab函数

小樊
86
2024-08-29 13:35:09
栏目: 编程语言

在Python中,你可以使用pandas库的crosstab函数来创建一个交叉表格,这有助于更好地理解两个或多个分类变量之间的关系

首先,确保已经安装了pandas库。如果没有,请使用以下命令安装:

pip install pandas

接下来,我们将使用一个简单的示例来演示如何使用crosstab函数。假设你有一个名为data.csv的CSV文件,其中包含以下内容:

Name,Gender,City
Alice,Female,New York
Bob,Male,San Francisco
Charlie,Male,New York
Debbie,Female,San Francisco

现在,我们将使用pandas读取此CSV文件,并使用crosstab函数创建一个基于性别和城市的交叉表格:

import pandas as pd

# 读取CSV文件
df = pd.read_csv('data.csv')

# 使用crosstab函数创建交叉表格
ct = pd.crosstab(df['Gender'], df['City'])

# 显示交叉表格
print(ct)

运行上述代码后,你将看到以下输出:

City      New York  San Francisco
Gender                        
Female            1             1
Male              1             1

这个交叉表格显示了不同性别和城市之间的计数。例如,在"New York"列和"Female"行的交叉点上,我们可以看到有1个女性。

0