Библиотека за сливане на PDF на Python с отворен код
Опитайте тази лесна за използване библиотека на Python с отворен код, която ви позволява без усилие да разделяте, съединявате, завъртате, разменяте и изтривате страници, което я прави универсален инструмент за нуждите на вашите PDF документи.
Какво е PyMuPDF?
PyMuPDF, известен също като Fitz, е библиотека на Python с отворен код, която предоставя изчерпателен набор от инструменти за работа с PDF файлове. С PyMuPDF потребителите могат ефективно да изпълняват задачи като отваряне на PDF файлове, извличане на текст и изображения, манипулиране на свойствата на страницата като завъртане и изрязване, създаване на нови PDF документи и конвертиране на PDF страници в изображения.
PyMuPDF поддържа няколко функции. В този преглед обаче основният ни фокус ще бъде върху функциите за разделяне, сливане и управление на страници в библиотеката на PDF. За задълбочена оценка на възможностите за извличане и анализиране, моля, щракнете тук.
Първи стъпки с PyMuPDF
Имате нужда от Python версия 3.8.0 или по-нова, за да инсталирате и използвате PyMuPDF. Така че, първо инсталирайте Python и след това използвайте командите по-долу, за да инсталирате PyMuPDF на вашата машина, като използвате pip и виртуална среда.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Обединете множество PDF файлове в един
Използвайки библиотеката PyMuPDF, можем да комбинираме множество PDF файлове в един PDF файл в Python. Следният кодов фрагмент обединява два PDF документа, като ги добавя един след друг и ги запазва като нов документ:
Разделете PDF на няколко файла
Възможно е също така да разделите PDF документ на множество PDF файлове в Python с помощта на библиотеката PyMuPDF. Следният кодов фрагмент разделя първите две страници на документ и ги съхранява като отделен PDF:
Завъртане на PDF страници
Можем също да завъртаме страници от PDF файл с помощта на библиотеката PyMuPDF. Ще използваме функцията set_rotation за завъртане на страниците в кодовия фрагмент по-долу:
Изход
Както виждаме, документът е завъртян на 90 градуса.
Изтриване на PDF страници
PyMuPDF може да се използва и за изтриване на страници от PDF файл. Ще използваме функцията delete_page, за да изтрием страниците. Следва документът, който е входът и кодът ще изтрие втората му страница:
Изход
Изображението по-долу показва модифицирания PDF файл, от който е премахната втората страница.
Заключение
PyMuPDF може да се похвали със забележителни силни страни при обединяването и манипулирането на страници в PDF документи. Неговата гъвкавост и ефективност при завъртане, изрязване, преоразмеряване и изтриване на страници го прави стабилен избор за задачи за модификация на PDF. Освен това способността на PyMuPDF да обединява безпроблемно множество PDF документи е забележително предимство.
Неговият сравнително сложен API обаче може да представлява крива на обучение за новодошлите и може да има някои ограничения при обработката на изключително големи или сложни PDF файлове, което може да повлияе на производителността. Независимо от това, обширните му възможности в тези области го правят ценен инструмент за тези, които търсят прецизен контрол върху PDF съдържанието.