Бібліотека Python PDF Merger з відкритим кодом
Спробуйте цю зручну бібліотеку Python із відкритим вихідним кодом, яка дозволяє легко розділяти, об’єднувати, обертати, міняти місцями та видаляти сторінки, що робить її універсальним інструментом для ваших PDF-документів.
Що таке PyMuPDF?
PyMuPDF, також відомий як Fitz, — це бібліотека Python з відкритим кодом, яка надає повний набір інструментів для роботи з файлами PDF. За допомогою PyMuPDF користувачі можуть ефективно виконувати такі завдання, як відкриття PDF-файлів, вилучення тексту та зображень, керування властивостями сторінки, як-от обертання та обрізання, створення нових PDF-документів і перетворення PDF-сторінок на зображення.
PyMuPDF підтримує кілька функцій. Однак у цьому огляді наша основна увага буде зосереджена на розділенні PDF-файлів, об’єднанні та функціях керування сторінками бібліотеки. Щоб отримати поглиблену оцінку можливостей вилучення та аналізу, натисніть тут.
Початок роботи з PyMuPDF
Щоб установити та використовувати PyMuPDF, вам потрібна версія Python 3.8.0 або новіша. Отже, спочатку встановіть Python, а потім скористайтеся наведеними нижче командами, щоб установити PyMuPDF на ваш комп’ютер за допомогою pip і віртуальне середовище.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
вікна
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Об’єднайте кілька PDF-файлів в один
Використовуючи бібліотеку PyMuPDF, ми можемо об’єднати кілька PDF-файлів в один PDF-файл на Python. Наступний фрагмент коду об’єднує два PDF-документи, додаючи один за одним, і зберігає його як новий документ:
Розділіть PDF на кілька файлів
Також можна розділити PDF-документ на кілька PDF-файлів у Python за допомогою бібліотеки PyMuPDF. Наступний фрагмент коду розділяє перші дві сторінки документа та зберігає їх як окремий PDF-файл:
Повертайте сторінки PDF
Ми також можемо обертати сторінки файлу PDF за допомогою бібліотеки PyMuPDF. Ми використаємо функцію set_rotation для повороту сторінок у наведеному нижче фрагменті коду:
Вихід
Як бачимо, документ повернуто на 90 градусів.
Видалити сторінки PDF
PyMuPDF також можна використовувати для видалення сторінок файлу PDF. Щоб видалити сторінки, ми використаємо функцію delete_page. Нижче наведено документ, який є вхідним, і код видалить його другу сторінку:
Вихід
На зображенні нижче показано змінений файл PDF, з якого видалено другу сторінку.
Висновок
PyMuPDF має надзвичайні переваги в об’єднанні та маніпуляції сторінками в документах PDF. Його гнучкість і ефективність обертання, обрізання, зміни розміру та видалення сторінок роблять його надійним вибором для завдань редагування PDF. Крім того, помітною перевагою є здатність PyMuPDF легко об’єднувати декілька PDF-документів.
Однак його відносно складний API може стати потрібним для новачків, і можуть існувати певні обмеження в обробці надзвичайно великих або складних PDF-файлів, що може вплинути на продуктивність. Незважаючи на це, його широкі можливості в цих сферах роблять його цінним інструментом для тих, хто шукає точного контролю над вмістом PDF.