Библиотека за сливане на PDF на Python с отворен код

Опитайте тази лесна за използване библиотека на Python с отворен код, която ви позволява без усилие да разделяте, съединявате, завъртате, разменяте и изтривате страници, което я прави универсален инструмент за нуждите на вашите PDF документи.

Какво е PyMuPDF?

PyMuPDF, известен също като Fitz, е библиотека на Python с отворен код, която предоставя изчерпателен набор от инструменти за работа с PDF файлове. С PyMuPDF потребителите могат ефективно да изпълняват задачи като отваряне на PDF файлове, извличане на текст и изображения, манипулиране на свойствата на страницата като завъртане и изрязване, създаване на нови PDF документи и конвертиране на PDF страници в изображения.

PyMuPDF поддържа няколко функции. В този преглед обаче основният ни фокус ще бъде върху функциите за разделяне, сливане и управление на страници в библиотеката на PDF. За задълбочена оценка на възможностите за извличане и анализиране, моля, щракнете тук.

GitHub

Статистика на GitHub

Име:
език:
звезди:
Вилици:
Разрешително:
Хранилището е последно актуализирано на

Първи стъпки с PyMuPDF

Имате нужда от Python версия 3.8.0 или по-нова, за да инсталирате и използвате PyMuPDF. Така че, първо инсталирайте Python и след това използвайте командите по-долу, за да инсталирате PyMuPDF на вашата машина, като използвате pip и виртуална среда.

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

MacOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Windows


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Обединете множество PDF файлове в един

Използвайки библиотеката PyMuPDF, можем да комбинираме множество PDF файлове в един PDF файл в Python. Следният кодов фрагмент обединява два PDF документа, като ги добавя един след друг и ги запазва като нов документ:

Разделете PDF на няколко файла

Възможно е също така да разделите PDF документ на множество PDF файлове в Python с помощта на библиотеката PyMuPDF. Следният кодов фрагмент разделя първите две страници на документ и ги съхранява като отделен PDF:

Завъртане на PDF страници

Можем също да завъртаме страници от PDF файл с помощта на библиотеката PyMuPDF. Ще използваме функцията set_rotation за завъртане на страниците в кодовия фрагмент по-долу:

Изход

Както виждаме, документът е завъртян на 90 градуса.

Изтриване на PDF страници

PyMuPDF може да се използва и за изтриване на страници от PDF файл. Ще използваме функцията delete_page, за да изтрием страниците. Следва документът, който е входът и кодът ще изтрие втората му страница:

Изход

Изображението по-долу показва модифицирания PDF файл, от който е премахната втората страница.

Заключение

PyMuPDF може да се похвали със забележителни силни страни при обединяването и манипулирането на страници в PDF документи. Неговата гъвкавост и ефективност при завъртане, изрязване, преоразмеряване и изтриване на страници го прави стабилен избор за задачи за модификация на PDF. Освен това способността на PyMuPDF да обединява безпроблемно множество PDF документи е забележително предимство.

Неговият сравнително сложен API обаче може да представлява крива на обучение за новодошлите и може да има някои ограничения при обработката на изключително големи или сложни PDF файлове, което може да повлияе на производителността. Независимо от това, обширните му възможности в тези области го правят ценен инструмент за тези, които търсят прецизен контрол върху PDF съдържанието.

Подобни Продукти

 Bulgarian