本篇内容介绍了“numpy数组读写文件怎么实现”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
import numpy as np a = np.array(range(20)).reshape((4, 5)) print(a) # 后缀改为 .txt 一样 filename = 'data/a.csv' # 写文件 np.savetxt(filename, a, fmt='%d', delimiter=',') # 读文件 b = np.loadtxt(filename, dtype=np.int32, delimiter=',') print(b)
缺点:
只能保存一维和二维 numpy 数组,当 numpy 数组 a 有多维时,需要将其 a.reshape((a.shape[0], -1)) 后才能用这种方式保存。
不能追加保存,即每次 np.savetxt() 都会覆盖之前的内容。
读写 npy 文件
import numpy as np a = np.array(range(20)).reshape((2, 2, 5)) print(a) filename = 'data/a.npy' # 写文件 np.save(filename, a) # 读文件 b = np.load(filename) print(b) print(b.shape)
优点:
npy 文件可以保存任意维度的 numpy 数组,不限于一维和二维;
npy 保存了 numpy 数组的结构,保存的时候是什么 shape 和 dtype,取出来时就是什么样的 shape 和 dtype。
缺点:
只能保存一个 numpy 数组,每次保存会覆盖掉之前文件中存在的内容(如果有的话)。
读写 npz 文件
import numpy as np a = np.array(range(20)).reshape((2, 2, 5)) b = np.array(range(20, 44)).reshape(2, 3 ,4) print('a:\n', a) print('b:\n', b) filename = 'data/a.npz' # 写文件, 如果不指定key,那么默认key为'arr_0'、'arr_1',一直排下去。 np.savez(filename, a, b=b) # 读文件 c = np.load(filename) print('keys of NpzFile c:\n', c.keys()) print("c['arr_0']:\n", c['arr_0']) print("c['b']:\n", c['b'])
优点:
npy 文件可以保存任意维度的 numpy 数组,不限于一维和二维;
npy 保存了 numpy 数组的结构,保存的时候是什么 shape 和 dtype,取出来时就是什么样的 shape 和 dtype;
可以同时保存多个 numpy 数组;
可以指定保存 numpy 数组的 key,读取的时候很方便,不会混乱。
缺点:
保存多个 numpy 数组时,只能同时保存,即 np.savez(filename, a, b=b)。每次保存会覆盖掉之前文件中存在的内容(如果有的话)。
优点:
不限 numpy 数组维度,可以保持 numpy 数组结构和数据类型;
适合 numpy 数组很大的情况,文件占用空间小;
可以通过 key 来访问 dataset(可以理解为 numpy.array),读取的时候很方便,不会混乱。
可以不覆盖原文件中含有的内容。
简单读取
import numpy as np import h6py a = np.array(range(20)).reshape((2, 2, 5)) b = np.array(range(20)).reshape((1, 4, 5)) print(a) print(b) filename = 'data/data.h6' # 写文件 h6f = h6py.File(filename, 'w') h6f.create_dataset('a', data=a) h6f.create_dataset('b', data=b) h6f.close() # 读文件 h6f = h6py.File(filename, 'r') print(type(h6f)) # 通过切片得到numpy数组 print(h6f['a'][:]) print(h6f['b'][:]) h6f.close() 通过切片赋值 import numpy as np import h6py a = np.array(range(20)).reshape((2, 2, 5)) print(a) filename = 'data/a.h6' # 写文件 h6f = h6py.File(filename, 'w') # 当数组a太大,需要切片进行操作时,可以不直接对h6f['a']进行初始化; # 当之后不需要改变h6f['a']的shape时,可以省略maxshape参数 h6f.create_dataset('a', shape=(2, 2, 5), maxshape=(None, 2, 5), dtype=np.int32, compression='gzip') for i in range(2): # 采用切片的形式赋值 h6f['a'][i] = a[i] h6f.close() # 读文件 h6f = h6py.File(filename, 'r') print(type(h6f)) print(h6f['a']) # 通过切片得到numpy数组 print(h6f['a'][:])
同一个 hdf5 文件可以创建多个 dataset,读取的时候按照 key 来即可。
“numpy数组读写文件怎么实现”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。