Библиотека Python PDF Merger с открытым исходным кодом

Попробуйте эту удобную библиотеку Python с открытым исходным кодом, которая позволяет вам без труда разделять, объединять, поворачивать, менять местами и удалять страницы, что делает ее универсальным инструментом для работы с PDF-документами.

Что такое PyMuPDF?

PyMuPDF, также известный как Fitz, — это библиотека Python с открытым исходным кодом, которая предоставляет полный набор инструментов для работы с файлами PDF. С PyMuPDF пользователи могут эффективно выполнять такие задачи, как открытие файлов PDF, извлечение текста и изображений, управление свойствами страницы, такими как поворот и обрезка, создание новых документов PDF и преобразование страниц PDF в изображения.

PyMuPDF поддерживает несколько функций. Однако в этом обзоре мы в первую очередь сосредоточимся на функциях библиотеки по разделению, слиянию и управлению страницами PDF. Для углубленной оценки возможностей извлечения и анализа, пожалуйста, нажмите здесь.

GitHub

Статистика GitHub

Имя:
Язык:
Звезды:
Вилки:
Лицензия:
Репозиторий последний раз обновлялся на

Начало работы с PyMuPDF

Вам понадобится Python версии 3.8.0 или выше для установки и использования PyMuPDF. Поэтому сначала установите Python, а затем используйте команды ниже для установки PyMuPDF на свой компьютер с помощью pip и виртуальной среды.

линукс


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

MacOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Окна


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Объединить несколько PDF-файлов в один

Используя библиотеку PyMuPDF, мы можем объединить несколько PDF-файлов в один PDF-файл в Python. Следующий фрагмент кода объединяет два PDF-документа, добавляя один за другим, и сохраняет его как новый документ:

Разделить PDF на несколько файлов

Также возможно разделить PDF-документ на несколько PDF-файлов в Python с помощью библиотеки PyMuPDF. Следующий фрагмент кода разделяет первые две страницы документа и сохраняет их как отдельный PDF-файл:

Поворот страниц PDF

Мы также можем вращать страницы PDF-файла с помощью библиотеки PyMuPDF. Мы будем использовать функцию set_rotation для вращения страниц в следующем фрагменте кода:

Выход

Как мы видим, документ повернут на 90 градусов.

Удалить страницы PDF

PyMuPDF также можно использовать для удаления страниц PDF-файла. Мы будем использовать функцию delete_page для удаления страниц. Ниже приведен документ, который является входными данными, а код удалит его вторую страницу:

Выход

На изображении ниже показан измененный PDF-файл, из которого удалена вторая страница.

Заключение

PyMuPDF может похвастаться замечательными возможностями в слиянии и манипулировании страницами в документах PDF. Его гибкость и эффективность при повороте, обрезке, изменении размера и удалении страниц делают его надежным выбором для задач по изменению PDF. Кроме того, способность PyMuPDF бесшовно объединять несколько документов PDF является заметным преимуществом.

Однако его относительно сложный API может представлять собой кривую обучения для новичков, и могут быть некоторые ограничения в обработке очень больших или сложных PDF-файлов, что может повлиять на производительность. Тем не менее, его обширные возможности в этих областях делают его ценным инструментом для тех, кто ищет точный контроль над содержимым PDF.

Похожие Продукты

 Русский