这期内容当中小编将会给大家带来有关使用Python怎么统计文件夹内所有pdf文件的页数,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能,该语言通俗易懂、容易入门、功能强大,在许多领域中都有广泛的应用,例如最热门的大数据分析,人工智能,Web开发等。
1.首先安装 PyPDF2 库:
pip install PyPDF2
2.然后保存下面文件(已带注释,具体实现请自己思考)
import os
import PyPDF2
#获取文件夹内所有pdf文件,以及打印文件数量
def GetFileInfo(path, fileType=()):
fileList = []
# root 表示当前正在访问的文件夹路径
# dirs 是 list , 表示该文件夹中所有的目录的名字(不包括子目录)
# files 是 list , 表示内容是该文件夹中所有的文件(不包括子目录)
#(每遍历一次相当于进入下级子目录)
for root, dirs, files in os.walk(path):
for name in files :
fname = os.path.join(root, name)
if fname.endswith(fileType):
fileList.append(fname)
print("总共有%d个PDF文件"%fileList.__len__())
return fileList
def compute_pdfpage(path):
TotalPageNum = 0
fileType = ("PDF","pdf")
fileList = GetFileInfo(path=path, fileType=fileType)
for pdf in fileList:
try:
reader = PyPDF2.PdfFileReader(pdf)
#获取单个文件页数
pageNum = reader.getNumPages()
TotalPageNum += pageNum
except Exception as e:
print("-"*70)
print(pdf + "该文件出现异常,可能是权限问题")
print(e)
print("-"*70)
return TotalPageNum
if __name__ == '__main__':
while True:
path=input('请输入要检测的文件夹路径:\n')
TotalPageNum = compute_pdfpage(path)
print("总共%d页"%TotalPageNum)
3.安装打包工具pyinstaller(只有安装了这个,才能将py文件生成为可以通过双击直接在windows执行的exe文件)
pip install pyinstaller
4.然后在py文件目录下的地址栏输入cmd调出当前路径下的终端。
5.在终端中输入如下命令后回车,-F后面跟的是 你要生成exe可执行文件所对应的py文件。
pyinstaller -F 检测文件夹内所有pdf的小工具.py
6.最终生成3个文件夹,可执行文件在dist文件夹中。
运行效果:
上述就是小编为大家分享的使用Python怎么统计文件夹内所有pdf文件的页数了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注亿速云行业资讯频道。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。