开源 Python PDF 合并库
尝试这个用户友好的开源 Python 库,它允许您轻松地拆分、合并、旋转、交换和删除页面,使其成为满足您的 PDF 文档需求的多功能工具。
什么是 PyMuPDF?
PyMuPDF,也称为 Fitz,是一个开源 Python 库,提供了一整套用于处理 PDF 文件的工具。使用 PyMuPDF,用户可以高效地执行打开 PDF、提取文本和图像、操作旋转和裁剪等页面属性、创建新 PDF 文档以及将 PDF 页面转换为图像等任务。
PyMuPDF 支持多种功能。然而,在本次审查中,我们的主要重点将是该库的 PDF 拆分、合并和页面管理功能。如需深入评估提取和解析功能,请单击此处。
PyMuPDF 入门
您需要 Python 版本 3.8.0 或更高版本才能安装和使用 PyMuPDF。因此,首先安装 Python,然后使用以下命令使用 pip 和虚拟环境。
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
苹果系统
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
视窗
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
将多个 PDF 合并为一个
使用 PyMuPDF 库,我们可以在 Python 中将多个 PDF 合并为一个 PDF 文件。以下代码片段通过将两个 PDF 文档一个接一个地附加在一起并将其另存为新文档,将两个 PDF 文档连接在一起:
将 PDF 拆分为多个文件
还可以使用 PyMuPDF 库在 Python 中将 PDF 文档拆分为多个 PDF。以下代码片段分割文档的前两页并将它们存储为单独的 PDF:
旋转 PDF 页面
我们还可以使用 PyMuPDF 库旋转 PDF 文件的页面。我们将使用 set_rotation 函数在下面的代码片段中旋转页面:
输出
正如我们所看到的,文档旋转了 90 度。
删除 PDF 页面
PyMuPDF 还可用于删除 PDF 文件的页面。我们将使用delete_page函数来删除页面。以下是作为输入的文档,代码将删除其第二页:
输出
下图显示了修改后的 PDF 文件,其中第二页已被删除。
结论
PyMuPDF 在 PDF 文档中的合并和页面操作方面拥有显着的优势。它在旋转、裁剪、调整大小和删除页面方面的灵活性和效率使其成为 PDF 修改任务的可靠选择。此外,PyMuPDF 无缝合并多个 PDF 文档的能力也是一个显着的优势。
然而,其相对复杂的 API 可能会给新手带来学习曲线,并且在处理极大或复杂的 PDF 时可能存在一些限制,这可能会影响性能。尽管如此,它在这些领域的广泛功能使其成为那些寻求精确控制 PDF 内容的人的宝贵工具。