python中怎么将pdf文件分割为图片,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
利用python将pdf转换成图片
最近,工作需要发送电子版word文档给别人,为了版权保护、防止文档内容被复制。于是,本人搜了很多教程,有了以下思路:
网上的教程利用word加水印,然后保存时选择pdf格式文档,但是我发现,生成pdf文档仍然可以被复制。等于没起到防止资料外泄,内容被复制的风险。
于是,我想到先用word加公司水印,并保存为pdf格式的文档,然后用高级版的福昕pdf阅读器【公众号后台留言索取】将pdf分割成一张张图片,最后再用福昕阅读器合并这些图片生成新的pdf文档。由于该文档由图片合并而来,自然就不会被复制。
其实除了用pdf阅读器拆分合并,photoshop也有类似的功能,将pdf导入ps软件中,每页以图片形式一页页保存,然后再用ps将图片导出为pdf格式的文档,这个过程也可以,但是当文档页数比较多时候,就比较麻烦了,这个方法费时间。
最后,决定用python来解决这个问题,方法:pdf拆分为图片、然后将图片合并为pdf文档。
今天就先记录如何将pdf分割为图片。
下面将pdf转换为图片需要准备库和压缩包:
pdf2image
压缩包proppler
首先,先安装pdf2image库,打开命令行输入以下:
pip install pdf2image
其次,proppler是pdf2image库使用的前提条件,我们需要下载proppler这个文件,下载地址:http://blog.alivate.com.au/poppler-windows/,复制这个网址到电脑端打开,找到Download下载那一行,根据电脑操作系统下载对应的版本,本人电脑window10系统,版本选择了最新版poppler-0.68.0_x86 ,此文件安装完后,解压到任意盘,本人C盘新建一个文件,然后解压到新建的文件,其他盘没有测试,应该无碍。然后在解压的文件里面找到bin文件夹,然后复制bin文件的文件路径(打开bin文件夹,如下,鼠标左键点击箭头标记的路径,然后选中该路径复制。
打开系统环境变量,
新建环境变量,如下:
然后粘贴刚才复制bin文件夹路径
然后一直按确定即可,上面的用户环境变量也是如此操作,将该路径添加到用户环境变量中。(具体添加环境变量操作步骤,自己上网搜)。
准备工作就完成了,下面是执行代码,运行成功,pdf就被分割成一张张图片。
import pdf2image
import os
images = pdf2image.convert_from_path("plan.pdf")
i =0
if not os.path.exists(r"D:\CS\学习笔记\小功能\pdf转图片\image"): # 查看文件夹是否存在
os.mkdir(r"D:\CS\学习笔记\小功能\pdf转图片\image") # 不存在就创建一个文件夹,此处文件名为image
for image in images:
i += 1
image.save("D:\CS\学习笔记\小功能\pdf转图片\image\\" + str(i)+ ".jpg","JPEG")
关于python中怎么将pdf文件分割为图片问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注亿速云行业资讯频道了解更多相关知识。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。