在Python中编辑PDF文件,你可以使用多个库,其中两个比较流行的库是`PyPDF2`和`PyMuPDF`(也称为`fitz`)。以下是使用这两个库编辑PDF文件的基本方法:
使用PyPDF2编辑PDF
安装PyPDF2
pip install PyPDF2
打开PDF文件
from PyPDF2 import PdfReader, PdfWriterwith open('example.pdf', 'rb') as file:reader = PdfReader(file)writer = PdfWriter()
获取PDF的页数
num_pages = len(reader.pages)print(f'PDF有{num_pages}页')
添加新的一页
new_page = PyPDF2.pdf.PageObject.create_blank_page(width=800, height=600)writer.add_page(new_page)
将修改后的PDF写入新文件
with open('modified_example.pdf', 'wb') as new_file:for page in reader.pages:writer.add_page(page)writer.write(new_file)
使用PyMuPDF编辑PDF

安装PyMuPDF
pip install pymupdf
打开PDF文档
import fitz PyMuPDFpdf_doc = fitz.open('example.pdf')
选择要修改的页面
page = pdf_doc
搜索文本并替换
search_text = '原始文本'new_text = search_text.replace('原始文本', '新文本')for inst in page.search_for(search_text):block = instspan = instpage.add_redact_annot(span.rect, fill=(1, 1, 1)) 先用白色覆盖旧文本new_text_obj = page.add_text(new_text, span.rect.x1, span.rect.y1, fontsize=12) 设置新文本new_text_obj.update() 更新文本对象
保存文档
pdf_doc.save('modified_example.pdf')
以上是使用`PyPDF2`和`PyMuPDF`修改PDF文档的基本步骤。你可以根据需要选择合适的库来进行更复杂的编辑操作,例如插入文本、图像或删除页面等。
