Open Source Python HTML-zu-PDF-Konvertierungsbibliothek
Probieren Sie diese kostenlose und Open Source-Python-Bibliothek zum Konvertieren von HTML- in PDF-Dokumente aus.
Was ist xhtml2pdf?
Xhtml2pdf ist eine Open-Source-Python-Bibliothek zum Konvertieren von HTML-Inhalten in PDF-Dokumente, wobei der Schwerpunkt auf der Beibehaltung der ursprünglichen Struktur und des Stils liegt. Diese leistungsstarke Bibliothek konvertiert Webseiten nahtlos in professionelle, druckfertige PDFs.
Erste Schritte mit xhtml2pdf
Sie benötigen Python Version 3.8.0 oder höher, um xhtml2pdf zu installieren und zu verwenden. Installieren Sie also zuerst Python und verwenden Sie dann die folgenden Befehle, um xhtml2pdf auf Ihrem Computer mit pip und virtueller Umgebung zu installieren.
Linux
python -m venv env
. env/bin/activate
pip install xhtml2pdf
MacOS
python -m venv env
. env/bin/activate
pip install xhtml2pdf
Windows
python -m venv env
.\env\Scripts\activate
pip install xhtml2pdf
Konvertieren einer HTML-Zeichenfolge in ein PDF-Dokument
Wir können eine HTML-Zeichenfolge mithilfe der xhtml2pdf-Bibliothek in ein PDF-Dokument konvertieren. Wir speichern den gesamten HTML-Inhalt in einer Variablen und übergeben diese Variable dann an die Funktion pisa.CreatePDF(html_content, dest, encoding). Diese Methode liefert uns den PDF-Inhalt, wobei Hyperlinks, Bilder und andere Elemente innerhalb eines BytesIO-Objekts verwaltet werden, das wir ihr übergeben haben. Schließlich erstellen wir eine PDF-Datei mithilfe der im BytesIO-Objekt gespeicherten Daten. Weitere Einzelheiten finden Sie im folgenden Codeausschnitt:
Ausgabe
Der folgende Screenshot zeigt das aus der HTML-Zeichenfolge konvertierte PDF-Dokument:
Konvertieren einer HTML-Datei in ein PDF-Dokument
Wir können eine HTML-Datei auch mithilfe der xhtml2pdf-Bibliothek in ein PDF konvertieren. Wir lesen den Inhalt der HTML-Datei in eine Variable ein und übergeben diese Variable dann an die Methode pisa.CreatePDF(html_content, dest, encoding). Danach folgen wir denselben Schritten wie im vorherigen Beispiel, um das PDF-Dokument mithilfe des Objekts BytesIO zu erstellen, wie im folgenden Codeausschnitt gezeigt:
Ausgabe
Der folgende Screenshot zeigt das aus der HTML-Datei konvertierte PDF-Dokument:
Abschluss
Zusammenfassend lässt sich sagen, dass xhtml2pdf eine Open-Source-Python-Bibliothek ist, die HTML- in PDF-Dokumente konvertiert und dabei Hyperlinks, Bilder und externe Stylesheets verarbeitet. xhtml2pdf schließt bei der Konvertierung von HTML in PDF keine Front-End-Bibliotheken ein. Wenn also Variablen wie {{name}} im HTML vorhanden sind, erscheinen sie im PDF genau so, wie sie im HTML geschrieben sind, und nicht mit ihren tatsächlichen Werten.
Darüber hinaus fehlt die Unterstützung für dynamische Seiten, die zum Abrufen von Inhalten JavaScript benötigen, und es befolgt keine komplexen CSS-spezifizierten Layouts (es wendet beispielsweise die im CSS genannten Farben, Schriftgrößen usw. an, ignoriert aber das Layout-CSS wie Auffüllungen, Ränder, Anzeige usw.). Trotz dieser Einschränkungen bleibt xhtml2pdf ein wertvolles Tool für einfache statische HTML-zu-PDF-Konvertierungsanforderungen.