CVS
CVS 是一个被分割符,列分割符划分成行和列的文本文件。
CVS 不指定字符编码,行分割符为\r\n,最后一行可以没有换行符,列分割符常为逗号或者制表符
每一行成为一条记录record,字段可以使用双引号括起来,也可以不使用。如果字段中刚出现了双引号、逗号、换行符必须使用双引号括起来。如果字段的值是双引号,使用两个双引号表示一个转义表头可选,和字段列对齐就行了。
CSV 模块
reader(csvfile,dialect = 'excel',**fmtpararms)
返回reader对象,是一个行迭代器。
默认使用excel方言,如下:
delimiter 列分割符,逗号
lineterminator 行分分割符\r\n
quatechar 字段的引用符号,缺省为“双引号
双引号的处理
doublequote双引号的处理,默认为Ture.如果碰到数据中有双引号,而quotechar也是双引号,Ture则使用2个双引号表示,False表示使用转义字符将作为双引号前缀
escapechar一个转义字符,默认为None
wrirter = csv.writer(f,doublequote=False,escapechar= '@')遇到双引号,则必须提供转义字符
quoting指定双引号的规则
QUOTE_ALL所有字段
QUOTE_MONMAL特殊字符字段,Excel方言使用该规则
QUOTE_NONNIMERIC非数字字段
QUOTE_NONE 都不使用引号
writer(csvfile,dialect = 'excel',**fmtpararms)
返回DictWriter的实例
主要方法有writerow、writerows
ini文件处理
作为配置文件,ini文件格式很流行。
configparser
configpartser模块的ConfigParser类就是用来操作。
可以将section当做key,section存储的键值对组成的字典,而可以把ini配置文件当做一个嵌套的字典,默认使用的是有序字典
read(filenames,encoding= None)
读取ini文件,可以是单个文件,也可以是文件列表,可以指定文件编码。
sections()返回sections列表,缺省section不包括在内
add_section(section_name)增加一个section
has_section(section_name)判断section是否存在
option(section)返回section的所有option,会追加缺省section的option
hash_option(section,option)判断section是否存在这个option
get(section,option,*,raw=Flase,vars=None[,fallback])
从指定的段的选项上取值,如果找到返回,如果没有找到就去找DEFAULT段有没有
getint(section,option,*,raw=False,vars=None[,fallback])
getfloat(section,option,*,raw=False,vars=None[,fallback])
getboolean(section,option,*,raw=False,vars=None[,fallback])
上面3个方法和get一样,返回指定类型数据
items(raw=False,vars=None)
items(section,raw=False,vars=None)
没有section,则返回所有section名字及对象,如果指定section,则返回指定的section的键值对组成二元组
set(section,option,value)
section 存在的情况下,写入option =value,要求option,value必须是字符串
remove_section(section)
移除section下的option
wrirte(fileobject,space-around_delimiters=Ture)
将当前config所有内容写入fileobject中,一般open函数使用w模式。
Json
Json(JavaScript Object Notation,JS对象标记)是一种轻量级的数据交换格式。它基于ECMAScript的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据
Json的数据类型
值
双引号引起来的字符串,数值,true和false,null,对象,数组,这些都是值
字符串
由双引号包围起来的任意字符的组合,可以转义字符。
数值
有正负,有整数,浮点数
对象
无序的键值对的集合
格式{key1:value1,.......keyn,valuen}
key必须是一个字符串,需要双引号包围这个字符
value可以是任意合法的值
数组
有序的值的集合
格式:[val1,....valn]
序列化与反序列化
定义:
serialization 序列化
将内存中对象存储下来,把它变成一个个字节----->二进制
deserialization 反序列化
将文件的一个个字节恢复成内存中对象<-----二进制
序列化保持到文件就是持久化
可以将数据序列化后持久化,或者网络传输,也可以将从文件中或者网络接受到的字节序列反序列化
Python提供了pickle库
pickle库
python中的序列化、福安序列化模块
dumps 对象序列化为bytes对象
dump 对象序列化到文件对象,就是存入文件
loads 从bytes对象反序列化
load 对象反序列化,从文件读取数据
序列化应用:
一般来说,本地序列化的情况较少。大多数场景都应用在网络传输中。
将数据序列化后通过网络传输到远程节点,远程服务器上的服务将接收到的数据反序列化后,就可以使用了。但要注意一点,远程接收端,反序列化是必须有对应的数据类型,否则就会报错
,尤其是自定义类,必须远程得有一致的定义。python程序之间可以使用pickle解决序列化、反序列化,如果跨平台,跨语言,跨协议pickle就不太合适了。就需要公共的协议,例如:XML、JSON、protocol Buffer等
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。