Biblioteka Open Source Python PDF Merger
Wypróbuj tę przyjazną dla użytkownika bibliotekę Pythona o otwartym kodzie źródłowym, która umożliwia łatwe dzielenie, łączenie, obracanie, podmienianie i usuwanie stron. Jest to wszechstronne narzędzie do obsługi dokumentów PDF.
Czym jest PyMuPDF?
PyMuPDF, znany również jako Fitz, to biblioteka Pythona typu open source, która zapewnia kompleksowy zestaw narzędzi do pracy z plikami PDF. Dzięki PyMuPDF użytkownicy mogą wydajnie wykonywać zadania, takie jak otwieranie plików PDF, wyodrębnianie tekstu i obrazów, manipulowanie właściwościami strony, takimi jak obrót i przycinanie, tworzenie nowych dokumentów PDF i konwertowanie stron PDF na obrazy.
PyMuPDF obsługuje kilka funkcji. Jednak w tej recenzji skupimy się głównie na funkcjach dzielenia, scalania i zarządzania stronami PDF w bibliotece. Aby uzyskać szczegółową ocenę możliwości ekstrakcji i parsowania, kliknij tutaj.
Pierwsze kroki z PyMuPDF
Potrzebujesz wersji Pythona 3.8.0 lub nowszej, aby zainstalować i używać PyMuPDF. Więc najpierw zainstaluj Python, a następnie użyj poniższych poleceń, aby zainstalować PyMuPDF na swoim komputerze, używając pip i środowiska wirtualnego.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
macOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Okna
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Połącz wiele plików PDF w jeden
Używając biblioteki PyMuPDF, możemy połączyć wiele plików PDF w jeden plik PDF w Pythonie. Poniższy fragment kodu łączy dwa dokumenty PDF, dodając jeden po drugim i zapisując go jako nowy dokument:
Podziel PDF na wiele plików
Możliwe jest również podzielenie dokumentu PDF na wiele plików PDF w Pythonie przy użyciu biblioteki PyMuPDF. Poniższy fragment kodu dzieli pierwsze dwie strony dokumentu i zapisuje je jako oddzielny plik PDF:
Obróć strony PDF
Możemy również obracać strony pliku PDF za pomocą biblioteki PyMuPDF. Użyjemy funkcji set_rotation, aby obrócić strony w poniższym fragmencie kodu:
Wyjście
Jak widać, dokument jest obrócony o 90 stopni.
Usuń strony PDF
PyMuPDF można również użyć do usuwania stron pliku PDF. Użyjemy funkcji delete_page, aby usunąć strony. Poniżej znajduje się dokument, który jest wejściem, a kod usunie jego drugą stronę:
Wyjście
Poniższy obraz przedstawia zmodyfikowany plik PDF, z którego usunięto drugą stronę.
Wniosek
PyMuPDF szczyci się niezwykłymi zaletami w łączeniu i manipulowaniu stronami w dokumentach PDF. Jego elastyczność i wydajność w obracaniu, przycinaniu, zmianie rozmiaru i usuwaniu stron sprawiają, że jest to solidny wybór do zadań modyfikacji PDF. Ponadto, zdolność PyMuPDF do płynnego łączenia wielu dokumentów PDF jest znaczącą zaletą.
Jednak jego stosunkowo złożony interfejs API może stanowić krzywą uczenia się dla nowicjuszy, a także mogą występować pewne ograniczenia w obsłudze ekstremalnie dużych lub złożonych plików PDF, co może mieć wpływ na wydajność. Niemniej jednak jego rozległe możliwości w tych obszarach sprawiają, że jest to cenne narzędzie dla osób poszukujących precyzyjnej kontroli nad treścią PDF.