Open-Source-Python-PDF-Merger-Bibliothek
Probieren Sie diese benutzerfreundliche Open-Source-Python-Bibliothek aus, mit der Sie Seiten mühelos teilen, verbinden, drehen, tauschen und löschen können, was sie zu einem vielseitigen Tool für Ihre PDF-Dokumentanforderungen macht.
Was ist PyMuPDF?
PyMuPDF, auch bekannt als Fitz, ist eine Open-Source-Python-Bibliothek, die umfassende Tools für die Arbeit mit PDF-Dateien bereitstellt. Mit PyMuPDF können Benutzer Aufgaben wie das Öffnen von PDFs, das Extrahieren von Text und Bildern, das Bearbeiten von Seiteneigenschaften wie Drehen und Zuschneiden, das Erstellen neuer PDF-Dokumente und das Konvertieren von PDF-Seiten in Bilder effizient ausführen.
PyMuPDF unterstützt mehrere Funktionen. In diesem Testbericht liegt unser Hauptaugenmerk jedoch auf den PDF-Aufteilungs-, Zusammenführungs- und Seitenverwaltungsfunktionen der Bibliothek. Für eine ausführliche Bewertung der Extraktions- und Analysefunktionen klicken Sie bitte hier.
Erste Schritte mit PyMuPDF
Sie benötigen Python Version 3.8.0 oder höher, um PyMuPDF zu installieren und zu verwenden. Installieren Sie also zuerst Python und verwenden Sie dann die folgenden Befehle, um PyMuPDF mit pip und virtuelle Umgebung.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Mac OS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Fügen Sie mehrere PDFs zu einem zusammen
Mithilfe der PyMuPDF-Bibliothek können wir in Python mehrere PDFs zu einer einzigen PDF-Datei kombinieren. Der folgende Codeausschnitt fügt zwei PDF-Dokumente durch Anhängen nacheinander zusammen und speichert es als neues Dokument:
Teilen Sie PDF in mehrere Dateien auf
Mit der PyMuPDF-Bibliothek ist es auch möglich, ein PDF-Dokument in Python in mehrere PDFs aufzuteilen. Der folgende Codeausschnitt teilt die ersten beiden Seiten eines Dokuments auf und speichert sie als separates PDF:
PDF-Seiten drehen
Mit der PyMuPDF-Bibliothek können wir auch Seiten einer PDF-Datei drehen. Wir werden die Funktion set_rotation verwenden, um die Seiten im folgenden Codeausschnitt zu drehen:
Ausgabe
Wie wir sehen können, ist das Dokument um 90 Grad gedreht.
PDF-Seiten löschen
PyMuPDF kann auch zum Löschen von Seiten einer PDF-Datei verwendet werden. Wir werden die Funktion delete_page verwenden, um die Seiten zu löschen. Es folgt das Dokument, das die Eingabe darstellt und dessen zweite Seite der Code löscht:
Ausgabe
Das Bild unten zeigt die geänderte PDF-Datei, aus der die zweite Seite entfernt wurde.
Abschluss
PyMuPDF verfügt über bemerkenswerte Stärken beim Zusammenführen und Bearbeiten von Seiten in PDF-Dokumenten. Seine Flexibilität und Effizienz beim Drehen, Zuschneiden, Ändern der Größe und Löschen von Seiten machen es zu einer robusten Wahl für PDF-Änderungsaufgaben. Darüber hinaus ist die Fähigkeit von PyMuPDF, mehrere PDF-Dokumente nahtlos zusammenzuführen, ein bemerkenswerter Vorteil.
Die relativ komplexe API stellt für Neueinsteiger jedoch möglicherweise eine Lernkurve dar, und es kann einige Einschränkungen bei der Verarbeitung extrem großer oder komplexer PDFs geben, die sich auf die Leistung auswirken können. Nichtsdestotrotz ist es aufgrund seiner umfangreichen Fähigkeiten in diesen Bereichen ein wertvolles Werkzeug für alle, die eine präzise Kontrolle über PDF-Inhalte suchen.