概述
Python 处理 PDF 文件需要安装相应的库:[PyPDF2] 库
使用场景
工作中可能会涉及处理 PDF 文件, PyPDF2 就是这样一个库, 使用它可以轻松的处理 PDF 文件, 它提供了读, 写, 分割, 合并, 文件转换等多种操作.
安装库
网站 https://pypi.org/project/PyPDF2/1.26.0/
使用说明
PyPDF2 官方文档 (documentation) https://pythonhosted.org/PyPDF2/
学习网站
博客
- # 导入相关类
- from PyPDF2 import PdfFileReader, PdfFileWriter
- # 定义输入文件和输出文件 (路径)
- inputFile = 'read.pdf'
- outputFile = 'write.pdf'
- # 获取一个 PdfFileReader 对象
- pdfReader = PdfFileReader(open(inputFile, 'rb'))
- # 获取 PDF 的页数
- pageCount = pdfReader.getNumPages()
- print(pageCount)
- # 返回一个 PageObject
- page = pdfReader.getPage(i)
- # 获取一个 PdfFileWriter 对象
- pdfWriter = PdfFileWriter()
- # 将一个 PageObject 加入到 PdfFileWriter 中
- pdfWriter.addPage(page)
- # 输出到文件中
- pdfWriter.write(open(outputFile, 'wb'))
- GitHub https://github.com/mstamy2/PyPDF2
提供了使用案例, 当我们使用的时候再具体查看.
来源: http://www.bubuko.com/infodetail-2869329.html