Pandas的Series和DataFrame怎么创建

发布时间：2022-11-03 17:40:54 阅读：156 作者：iii 栏目：编程语言

开发者测试专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

本篇内容介绍了“Pandas的Series和DataFrame怎么创建”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

一、Pandas 简介

Pandas是使用Python语言开发的用于数据处理和数据分析的第三方库。它擅长处理数字型数据和时间序列数据，当然文本型的数据也能轻松处理。 Pandas 可以处理的数据格式非常多，常见的数据文件格式都可以快速导入，比如 CSV、JSON、SQL、Microsoft Excel 导入数据。

二、Pandas 数据结构

Pandas 的主要数据结构有两种，分别是： Series （一维数据）与 DataFrame（二维数据）;所以后面的内容也是围绕着这两部门展开的；

2.1 Series （一维数据）

似于一维数组的对象，它由一组数据（各种Numpy数据类型）以及一组与之相关的数据标签（即索引）组成。即：Series 与Numpy 数组基本是一样的，只不过多了数据标签（索引）；

Series 格式： pandas.Series( data, index, dtype, name, copy)

参数说明：

参数	解释说明
data	一组数据(ndarray 类型) ，即Numpy数据；
index	数据索引标签，如果不指定，默认从 0 开始。
dtype	数据类型，默认会自己判断。
name	设置名称。（不常用）
copy	拷贝数据，默认为 False。（不常用）

Series 举例：

import pandas as pd

a = ['x','y','z']
b = [1,2,3]
mynum1 = pd.Series(b)
print(mynum1)
# 0    1
# 1    2
# 2    3

mynum2 = pd.Series(b,index=a)
print(mynum2)
# x    1
# y    2
# z    3
# dtype: int64

mynum3 = pd.Series(b,index=a,dtype=float)
print(mynum3)
# x    1.0
# y    2.0
# z    3.0
# dtype: float64

注意事项：
一般情况下，当我们导入pandas的时候，都会将Pandas重命名为pd（因为大家都这么做；）
当不指定index时，会默认index是一个从0开始的整数数组，即：0,1,2....；例如：上例中的mynum1；
当不指定dtype时，pandas会自己判断一个最合适的数据类型；例如：上例中的mynum2；
也可以自己指定index与dtype, 这样pandas会按照我们指定的数据生成；例如：上例中的mynum3；

2.2 DataFrame（二维数据）

类似于二维数组的对象，是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔型值）。DataFrame 既有行索引也有列索引；可以当作是许多个共用同一个索引的Series组成的数据结构；DataFrame 图解如下：

Pandas的Series和DataFrame怎么创建

上图所表示的就是一个由n 个Series组成的DataFrame; 所有的Series 共享同一个Index ;

DataFrame 格式：pandas.DataFrame( data, index, columns, dtype, copy)

参数说明：

参数	解释说明
data	一组数据(ndarray 类型) ，即Numpy数据；
index	数据索引标签，也可称为行标签
columns	数据列标签，如果不指定，默认从 0 开始。也可称为列标签。
dtype	数据类型，默认会自己判断。
copy	拷贝数据，默认为 False。（不常用）

三、Series 的创建

3.1 由数创建

不指定Index的时候，用单个数值只能创建一个元素的Series;

mySer = pd.Series(2)
print(mySer)  
# 0    2
# dtype: int64

通过指定Index 可以生成多个相同元素的Series，举例如下：

mySer = pd.Series(2,index=range(3))
print(mySer)
# 0    2
# 1    2
# 2    2
# dtype: int64

3.2 由列表创建

当不指定Index的时候，会默认生成RangeIndex(start=0, stop=n-1, step=1)的Index; 举例如下：

lis = [3,4,5]
mySer = pd.Series(lis)
print(mySer)
# 0    3
# 1    4
# 2    5
# dtype: int64
print(mySer.index)
# RangeIndex(start=0, stop=3, step=1)
print(mySer.values)
# [3 4 5]

也可以指定Index, 举例如下：

lis = [3,4,5]
ind = ["马里奥","路易吉","林克"]
mySer = pd.Series(lis,index=ind)
print(mySer)
# 马里奥    3
# 路易吉    4
# 林克     5
# dtype: int64
print(mySer.index)
# Index(['马里奥', '路易吉', '林克'], dtype='object')
print(mySer.values)
# [3 4 5]

3.3 由字典创建

dic = {'马里奥':3,'路易吉':4,'林克':5}
mySer = pd.Series(dic)
print(mySer)   
# 马里奥    3
# 路易吉    4
# 林克     5
# dtype: int64
print(mySer.index)  
# Index(['马里奥', '路易吉', '林克'], dtype='object')
print(mySer.values)
# [3 4 5]

3.4 由Numpy数组创建

array = np.array([0, 1, 2, 3])
mySer = pd.Series(array)
print(mySer)   
# 0    0
# 1    1
# 2    2
# 3    3
# dtype: int32
print(mySer.index)
# RangeIndex(start=0, stop=4, step=1)
print(mySer.values)
# [0 1 2 3]

四、DataFreme 的创建

由字典创建

dict1 = {'马里奥':[2,3,4],'路易吉':[5,6,7],'林克':[8,9,0]}
df = pd.DataFrame(dict1,index=["英雄%s"%i for i in range(1,4)])
print(df)
#      马里奥  路易吉  林克
# 英雄1    2     5     8      
# 英雄2    3     6     9      
# 英雄3    4     7     0

由Series创建

ser1 = pd.Series(np.arange(0,5,1))   
ser2 = pd.Series(np.arange(5,10,1))  
df = pd.DataFrame({'A':ser1,'B':ser2})
print(df)
#    A  B
# 0  0  5
# 1  1  6
# 2  2  7
# 3  3  8
# 4  4  9

由二维数组创建

arr = np.arange(9).reshape(3,3)
df = pd.DataFrame(arr,columns=['A','B','C'],index=['IN1','IN2','IN3'])
print(df)
#      A  B  C
# IN1  0  1  2
# IN2  3  4  5
# IN3  6  7  8

由列表创建

lis1=[1,2,3]
lis2=[2,3,4]
df = pd.DataFrame({'A':lis1,'B':lis2},index=['IN1','IN2','IN3'])
print(df)
#      A  B
# IN1  1  2
# IN2  2  3
# IN3  3  4

“Pandas的Series和DataFrame怎么创建”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站，小编将为大家输出更多高质量的实用文章！

亿速云「云服务器」，即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘，价格低至29元/月。点击查看>>

向AI问一下细节

Pandas的Series和DataFrame怎么创建

一、Pandas 简介

二、Pandas 数据结构

2.1 Series （一维数据）

2.2 DataFrame（二维数据）

三、Series 的创建

3.1 由数创建

3.2 由列表创建

3.3 由字典创建

3.4 由Numpy数组创建

四、DataFreme 的创建

由字典创建

由Series创建

由二维数组创建

由列表创建

猜你喜欢

最新资讯

相关推荐

开发者交流群：

相关标签