Open Source Python PDF Merger-Bibliothek
Probieren Sie diese benutzerfreundliche Open-Source-Python-Bibliothek aus, mit der Sie mühelos Seiten teilen, zusammenfügen, drehen, austauschen und löschen können, was sie zu einem vielseitigen Tool für Ihre PDF-Dokumentanforderungen macht.
Was ist PyMuPDF?
PyMuPDF, auch bekannt als Fitz, ist eine Open-Source-Python-Bibliothek, die einen umfassenden Satz an Tools für die Arbeit mit PDF-Dateien bietet. Mit PyMuPDF können Benutzer Aufgaben wie das Öffnen von PDFs, das Extrahieren von Text und Bildern, das Bearbeiten von Seiteneigenschaften wie Drehen und Zuschneiden, das Erstellen neuer PDF-Dokumente und das Konvertieren von PDF-Seiten in Bilder effizient ausführen.
PyMuPDF unterstützt mehrere Funktionen. In dieser Rezension konzentrieren wir uns jedoch hauptsächlich auf die Funktionen der Bibliothek zum Aufteilen, Zusammenführen und Verwalten von PDF-Dateien. Für eine ausführliche Bewertung der Extraktions- und Analysefunktionen klicken Sie bitte hier.
Erste Schritte mit PyMuPDF
Sie benötigen Python Version 3.8.0 oder höher, um PyMuPDF zu installieren und zu verwenden. Installieren Sie also zuerst Python und verwenden Sie dann die folgenden Befehle, um PyMuPDF mit pip und virtueller Umgebung auf Ihrem Computer zu installieren.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Mehrere PDFs zu einer zusammenfügen
Mithilfe der PyMuPDF-Bibliothek können wir in Python mehrere PDFs zu einer einzigen PDF-Datei zusammenfügen. Der folgende Codeausschnitt fügt zwei PDF-Dokumente zusammen, indem er sie nacheinander anhängt und als neues Dokument speichert:
PDF in mehrere Dateien aufteilen
Es ist auch möglich, ein PDF-Dokument in Python mithilfe der PyMuPDF-Bibliothek in mehrere PDFs aufzuteilen. Der folgende Codeausschnitt teilt die ersten beiden Seiten eines Dokuments auf und speichert sie als separates PDF:
PDF-Seiten drehen
Wir können Seiten einer PDF-Datei auch mit der PyMuPDF-Bibliothek drehen. Wir verwenden die Funktion set_rotation, um die Seiten im folgenden Codeausschnitt zu drehen:
Ausgabe
Wie wir sehen, ist das Dokument um 90 Grad gedreht.
PDF-Seiten löschen
PyMuPDF kann auch zum Löschen von Seiten einer PDF-Datei verwendet werden. Wir verwenden die Funktion delete_page zum Löschen der Seiten. Das folgende Dokument dient als Eingabe und der Code löscht die zweite Seite:
Ausgabe
Das folgende Bild zeigt die geänderte PDF-Datei, aus der die zweite Seite entfernt wurde.
Abschluss
PyMuPDF bietet bemerkenswerte Stärken beim Zusammenführen und Bearbeiten von Seiten in PDF-Dokumenten. Seine Flexibilität und Effizienz beim Drehen, Zuschneiden, Ändern der Größe und Löschen von Seiten machen es zu einer robusten Wahl für PDF-Änderungsaufgaben. Darüber hinaus ist die Fähigkeit von PyMuPDF, mehrere PDF-Dokumente nahtlos zusammenzuführen, ein bemerkenswerter Vorteil.
Die relativ komplexe API kann jedoch für Neulinge eine Lernkurve bedeuten und es kann einige Einschränkungen bei der Verarbeitung extrem großer oder komplexer PDFs geben, die die Leistung beeinträchtigen können. Dennoch machen die umfangreichen Fähigkeiten in diesen Bereichen es zu einem wertvollen Werkzeug für alle, die eine präzise Kontrolle über PDF-Inhalte suchen.