Бібліотека Python PDF Merger з відкритим кодом

Спробуйте цю зручну бібліотеку Python із відкритим вихідним кодом, яка дозволяє легко розділяти, об’єднувати, обертати, міняти місцями та видаляти сторінки, що робить її універсальним інструментом для ваших PDF-документів.

Що таке PyMuPDF?

PyMuPDF, також відомий як Fitz, — це бібліотека Python з відкритим кодом, яка надає повний набір інструментів для роботи з файлами PDF. За допомогою PyMuPDF користувачі можуть ефективно виконувати такі завдання, як відкриття PDF-файлів, вилучення тексту та зображень, керування властивостями сторінки, як-от обертання та обрізання, створення нових PDF-документів і перетворення PDF-сторінок на зображення.

PyMuPDF підтримує кілька функцій. Однак у цьому огляді наша основна увага буде зосереджена на розділенні PDF-файлів, об’єднанні та функціях керування сторінками бібліотеки. Щоб отримати поглиблену оцінку можливостей вилучення та аналізу, натисніть тут.

GitHub

Статистика GitHub

Ім'я:
Мова:
зірки:
Вилки:
Ліцензія:
Репозиторій востаннє оновлено о

Початок роботи з PyMuPDF

Щоб установити та використовувати PyMuPDF, вам потрібна версія Python 3.8.0 або новіша. Отже, спочатку встановіть Python, а потім скористайтеся наведеними нижче командами, щоб установити PyMuPDF на ваш комп’ютер за допомогою pip і віртуальне середовище.

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

MacOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

вікна


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Об’єднайте кілька PDF-файлів в один

Використовуючи бібліотеку PyMuPDF, ми можемо об’єднати кілька PDF-файлів в один PDF-файл на Python. Наступний фрагмент коду об’єднує два PDF-документи, додаючи один за одним, і зберігає його як новий документ:

Розділіть PDF на кілька файлів

Також можна розділити PDF-документ на кілька PDF-файлів у Python за допомогою бібліотеки PyMuPDF. Наступний фрагмент коду розділяє перші дві сторінки документа та зберігає їх як окремий PDF-файл:

Повертайте сторінки PDF

Ми також можемо обертати сторінки файлу PDF за допомогою бібліотеки PyMuPDF. Ми використаємо функцію set_rotation для повороту сторінок у наведеному нижче фрагменті коду:

Вихід

Як бачимо, документ повернуто на 90 градусів.

Видалити сторінки PDF

PyMuPDF також можна використовувати для видалення сторінок файлу PDF. Щоб видалити сторінки, ми використаємо функцію delete_page. Нижче наведено документ, який є вхідним, і код видалить його другу сторінку:

Вихід

На зображенні нижче показано змінений файл PDF, з якого видалено другу сторінку.

Висновок

PyMuPDF має надзвичайні переваги в об’єднанні та маніпуляції сторінками в документах PDF. Його гнучкість і ефективність обертання, обрізання, зміни розміру та видалення сторінок роблять його надійним вибором для завдань редагування PDF. Крім того, помітною перевагою є здатність PyMuPDF легко об’єднувати декілька PDF-документів.

Однак його відносно складний API може стати потрібним для новачків, і можуть існувати певні обмеження в обробці надзвичайно великих або складних PDF-файлів, що може вплинути на продуктивність. Незважаючи на це, його широкі можливості в цих сферах роблять його цінним інструментом для тих, хто шукає точного контролю над вмістом PDF.

Подібні Продукти

 Ukrainian