如何解决Python复杂zip文件的解压问题

发布时间：2021-12-13 09:09:26 阅读：604 作者：iii 栏目：开发技术

Python开发者专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

这篇文章主要介绍“如何解决Python复杂zip文件的解压问题”，在日常操作中，相信很多人在如何解决Python复杂zip文件的解压问题问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”如何解决Python复杂zip文件的解压问题”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

废话不多说，直接看问题，使用过 Python 中的标准库 zipfile 解压过 zip 格式压缩包的朋友们，可能遇到过，当压缩文件中的目录或文件名中包含中文等常见 unicode 字符时，典型如下面的例子：

如何解决Python复杂zip文件的解压问题

使用 zipfile 的 extract() 或 extractall() 方法直接解压时，产生的解压结果名充斥着乱码，这一点我们通过调用 namelist() 方法就可以看出来：

from zipfile import ZipFile

# 读入压缩包文件
file = ZipFile('示例压缩包.zip')

# 查看压缩包内目录、文件名称
file.namelist()

如何解决Python复杂zip文件的解压问题

这是因为 zipfile 中针对压缩包内容的编码兼容性差，但我们可以通过下面的函数自行矫正：

def recode(raw: str) -> str:
    '''
    编码修正
    '''
    
    try:
        return raw.encode('cp437').decode('gbk')
    
    except:
        return raw.encode('utf-8').decode('utf-8')
    
for file_or_path in file.namelist():
    
    print(file_or_path, ' -------> ' , recode(file_or_path))

如何解决Python复杂zip文件的解压问题

解决了文件名乱码的问题后，接下来我们就可以配合 shutil 与 os 标准库中的相关功能，实现将指定任意 zip 压缩包，完好地解压到指定的目录中，代码如下：

def zip_extract_all(src_zip_file: ZipFile, target_path: str) -> None:
    
    # 遍历压缩包内所有内容
    for file_or_path in file.namelist():
        
        # 若当前节点是文件夹
        if file_or_path.endswith('/'):
            try:
                # 基于当前文件夹节点创建多层文件夹
                os.makedirs(os.path.join(target_path, recode(file_or_path)))
            except FileExistsError:
                # 若已存在则跳过创建过程
                pass
        
        # 否则视作文件进行写出
        else:
            # 利用shutil.copyfileobj，从压缩包io流中提取目标文件内容写出到目标路径
            with open(os.path.join(target_path, recode(file_or_path)), 'wb') as z:
                # 这里基于Zipfile.open()提取文件内容时需要使用原始的乱码文件名
                shutil.copyfileobj(src_zip_file.open(file_or_path), z)
            
# 向已存在的指定文件夹完整解压当前读入的zip文件
zip_extract_all(file, '解压测试')

可以看到，效果完美：

如何解决Python复杂zip文件的解压问题

到此，关于“如何解决Python复杂zip文件的解压问题”的学习就结束了，希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习，快去试试吧！若想继续学习更多相关知识，请继续关注亿速云网站，小编会继续努力为大家带来更多实用的文章！

亿速云「云服务器」，即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘，价格低至29元/月。点击查看>>

向AI问一下细节

如何解决Python复杂zip文件的解压问题

猜你喜欢

最新资讯

相关推荐

开发者交流群：

相关标签