这篇文章给大家介绍利用python解压zip包时出现中文乱码如何解决,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
乱码得原因:
由于ZipFile模块导出遇到中文解码不对,windows上会出现,linux是否会出现不知道没测试过。
解决方式:
1. 搞个文件名引射表(不太方便,少量文件夹套用时候还可以)
2. 修改源码解码格式(不太方便,自己搞了一下,之后报其他错误)
3. 自己写入文件,自己创建文件夹(推荐)
自己创建的写法:
with zipfile.ZipFile(file=zip_save_path, mode='r') as zf: # 解压到指定目录,首先创建一个解压目录 os.mkdir(unzip_dir_path) for old_name in zf.namelist(): # 获取文件大小,目的是区分文件夹还是文件,如果是空文件应该不好用。 file_size = zf.getinfo(old_name).file_size # 由于源码遇到中文是cp437方式,所以解码成gbk,windows即可正常 new_name = old_name.encode('cp437').decode('gbk') # 拼接文件的保存路径 new_path = os.path.join(unzip_dir_path, new_name) # 判断文件是文件夹还是文件 if file_size > 0: # 是文件,通过open创建文件,写入数据 with open(file=new_path, mode='wb') as f: # zf.read 是读取压缩包里的文件内容 f.write(zf.read(old_name)) else: # 是文件夹,就创建
关于利用python解压zip包时出现中文乱码如何解决就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。