Python PDF处理模块pypdf库详解
pypdf库是一个Python库,用于处理PDF文件。以下是一些常用的功能和相应的代码示例:
- 合并PDF文件:
from PyPDF2 import PdfMerger
merger = PdfMerger()
merger.merge('file1.pdf', 'file2.pdf', output='merged.pdf')
merger.close()
- 拆分PDF文件:
from PyPDF2 import PdfReader, PdfWriter
reader = PdfReader('source.pdf')
writer = PdfWriter()
# 拆分为单页PDF
for page in reader.pages:
writer.add_page(page)
with open('output.pdf', 'wb') as output_pdf:
writer.write(output_pdf)
- 获取PDF文件信息:
from PyPDF2 import PdfReader
reader = PdfReader('example.pdf')
# 获取页数
page_count = len(reader.pages)
# 获取文档信息
doc_info = reader.get_document_info()
- 添加水印到PDF文件:
from PyPDF2 import PdfReader, PdfWriter
reader = PdfReader('input.pdf')
writer = PdfWriter()
# 创建水印页面
water_mark = PdfReader('watermark.pdf')
page = reader.pages[0]
page.merge_page(water_mark.pages[0])
writer.add_page(page)
# 添加剩余页面
for i in range(1, len(reader.pages)):
writer.add_page(reader.pages[i])
with open('output.pdf', 'wb') as output_pdf:
writer.write(output_pdf)
以上代码示例展示了如何使用pypdf库进行PDF文件的基本操作,如合并、拆分、获取信息以及添加水印。
评论已关闭