numpy数组读写文件怎么实现

发布时间：2023-02-24 17:42:26 来源：亿速云阅读：109 作者：iii 栏目：开发技术

本篇内容介绍了“numpy数组读写文件怎么实现”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

通过 numpy 读写 txt 或 csv 文件

import numpy as np

a = np.array(range(20)).reshape((4, 5))
print(a)

# 后缀改为 .txt 一样
filename = 'data/a.csv'
# 写文件
np.savetxt(filename, a, fmt='%d', delimiter=',')

# 读文件
b = np.loadtxt(filename, dtype=np.int32, delimiter=',')
print(b)

缺点：

只能保存一维和二维 numpy 数组，当 numpy 数组 a 有多维时，需要将其 a.reshape((a.shape[0], -1)) 后才能用这种方式保存。
不能追加保存，即每次 np.savetxt() 都会覆盖之前的内容。

通过 numpy 读写 npy 或 npz 文件

读写 npy 文件

import numpy as np

a = np.array(range(20)).reshape((2, 2, 5))
print(a)

filename = 'data/a.npy'
# 写文件
np.save(filename, a)

# 读文件
b = np.load(filename)
print(b)
print(b.shape)

优点：

npy 文件可以保存任意维度的 numpy 数组，不限于一维和二维；
npy 保存了 numpy 数组的结构，保存的时候是什么 shape 和 dtype，取出来时就是什么样的 shape 和 dtype。

缺点：

只能保存一个 numpy 数组，每次保存会覆盖掉之前文件中存在的内容（如果有的话）。

读写 npz 文件

import numpy as np

a = np.array(range(20)).reshape((2, 2, 5))
b = np.array(range(20, 44)).reshape(2, 3 ,4)
print('a:\n', a)
print('b:\n', b)

filename = 'data/a.npz'
# 写文件， 如果不指定key，那么默认key为'arr_0'、'arr_1'，一直排下去。
np.savez(filename, a, b=b)

# 读文件
c = np.load(filename)
print('keys of NpzFile c:\n', c.keys())
print("c['arr_0']:\n", c['arr_0'])
print("c['b']:\n", c['b'])

优点：

npy 文件可以保存任意维度的 numpy 数组，不限于一维和二维；
npy 保存了 numpy 数组的结构，保存的时候是什么 shape 和 dtype，取出来时就是什么样的 shape 和 dtype；
可以同时保存多个 numpy 数组；
可以指定保存 numpy 数组的 key，读取的时候很方便，不会混乱。

缺点：

保存多个 numpy 数组时，只能同时保存，即 np.savez(filename, a, b=b)。每次保存会覆盖掉之前文件中存在的内容（如果有的话）。

通过 h6py 读写 hdf5 文件

优点：

不限 numpy 数组维度，可以保持 numpy 数组结构和数据类型；
适合 numpy 数组很大的情况，文件占用空间小；
可以通过 key 来访问 dataset（可以理解为 numpy.array），读取的时候很方便，不会混乱。
可以不覆盖原文件中含有的内容。

简单读取

import numpy as np
import h6py

a = np.array(range(20)).reshape((2, 2, 5))
b = np.array(range(20)).reshape((1, 4, 5))
print(a)
print(b)

filename = 'data/data.h6'
# 写文件
h6f = h6py.File(filename, 'w')
h6f.create_dataset('a', data=a)
h6f.create_dataset('b', data=b)
h6f.close()

# 读文件
h6f = h6py.File(filename, 'r')
print(type(h6f))
# 通过切片得到numpy数组
print(h6f['a'][:])
print(h6f['b'][:])
h6f.close()
通过切片赋值
import numpy as np
import h6py

a = np.array(range(20)).reshape((2, 2, 5))
print(a)

filename = 'data/a.h6'
# 写文件
h6f = h6py.File(filename, 'w')
# 当数组a太大，需要切片进行操作时，可以不直接对h6f['a']进行初始化；
# 当之后不需要改变h6f['a']的shape时，可以省略maxshape参数
h6f.create_dataset('a', shape=(2, 2, 5), maxshape=(None, 2, 5), dtype=np.int32, compression='gzip')
for i in range(2):
    # 采用切片的形式赋值
    h6f['a'][i] = a[i]
h6f.close()

# 读文件
h6f = h6py.File(filename, 'r')
print(type(h6f))
print(h6f['a'])
# 通过切片得到numpy数组
print(h6f['a'][:])

同一个 hdf5 文件可以创建多个 dataset，读取的时候按照 key 来即可。

“numpy数组读写文件怎么实现”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站，小编将为大家输出更多高质量的实用文章！

向AI问一下细节

numpy数组读写文件怎么实现

通过 numpy 读写 txt 或 csv 文件

通过 numpy 读写 npy 或 npz 文件

通过 h6py 读写 hdf5 文件

猜你喜欢

最新资讯

相关推荐

相关标签