Biblioteka łączenia plików PDF w formacie Open Source w języku Python

Wypróbuj tę przyjazną dla użytkownika bibliotekę Pythona o otwartym kodzie źródłowym, która pozwala bez wysiłku dzielić, łączyć, obracać, zamieniać i usuwać strony, co czyni ją wszechstronnym narzędziem do obsługi dokumentów PDF.

Co to jest PyMuPDF?

PyMuPDF, znany również jako Fitz, to biblioteka Pythona typu open source, która zapewnia kompleksowy zestaw narzędzi do pracy z plikami PDF. Dzięki PyMuPDF użytkownicy mogą wydajnie wykonywać zadania, takie jak otwieranie plików PDF, wyodrębnianie tekstu i obrazów, manipulowanie właściwościami strony, takimi jak obracanie i przycinanie, tworzenie nowych dokumentów PDF i konwertowanie stron PDF na obrazy.

PyMuPDF obsługuje kilka funkcji. Jednak w tej recenzji skupimy się głównie na funkcjach dzielenia, łączenia i zarządzania stronami plików PDF w bibliotece. Aby uzyskać szczegółową ocenę możliwości ekstrakcji i analizowania, kliknij tutaj.

GitHub

Statystyki GitHuba

Nazwa:
Język:
Gwiazdy:
Widły:
Licencja:
Repozytorium zostało ostatnio zaktualizowane o godzinie

Pierwsze kroki z PyMuPDF

Aby zainstalować i używać PyMuPDF, potrzebujesz Pythona w wersji 3.8.0 lub wyższej. Zatem najpierw zainstaluj Python, a następnie użyj poniższych poleceń, aby zainstalować PyMuPDF na swoim komputerze za pomocą pip i środowisko wirtualne.

Linuksa


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

System operacyjny Mac


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Okna


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

Połącz wiele plików PDF w jeden

Korzystając z biblioteki PyMuPDF, możemy połączyć wiele plików PDF w jeden plik PDF w Pythonie. Poniższy fragment kodu łączy dwa dokumenty PDF, dołączając jeden po drugim i zapisując go jako nowy dokument:

Podziel plik PDF na wiele plików

Możliwe jest również podzielenie dokumentu PDF na wiele plików PDF w Pythonie przy użyciu biblioteki PyMuPDF. Poniższy fragment kodu dzieli pierwsze dwie strony dokumentu i przechowuje je jako oddzielny plik PDF:

Obróć strony PDF

Możemy również obracać strony pliku PDF za pomocą biblioteki PyMuPDF. Do obracania stron w poniższym fragmencie kodu użyjemy funkcji set_rotation:

Jak widać dokument jest obrócony o 90 stopni.

Usuń strony PDF

PyMuPDF może być również używany do usuwania stron pliku PDF. Do usunięcia stron użyjemy funkcji delete_page. Poniżej znajduje się dokument będący danymi wejściowymi, a kod usunie jego drugą stronę:

Poniższy obrazek przedstawia zmodyfikowany plik PDF, z którego usunięto drugą stronę.

Wniosek

PyMuPDF może poszczycić się niezwykłymi zaletami w zakresie łączenia i manipulacji stronami w dokumentach PDF. Jego elastyczność i wydajność w obracaniu, przycinaniu, zmianie rozmiaru i usuwaniu stron sprawiają, że jest to solidny wybór do zadań modyfikacji plików PDF. Ponadto zauważalną zaletą jest zdolność PyMuPDF do płynnego łączenia wielu dokumentów PDF.

Jednak jego stosunkowo złożony interfejs API może wymagać nauki dla nowicjuszy, a w obsłudze wyjątkowo dużych lub złożonych plików PDF mogą występować pewne ograniczenia, co może mieć wpływ na wydajność. Niemniej jednak jego szerokie możliwości w tych obszarach czynią go cennym narzędziem dla osób poszukujących precyzyjnej kontroli nad zawartością plików PDF.

Podobne Produkty

 Polish