Open-Source-Python-HTML-zu-PDF-Konvertierungsbibliothek
Probieren Sie diese kostenlose und Open-Source-Python-Bibliothek aus, um HTML in PDF-Dokumente zu konvertieren.
Was ist xhtml2pdf?
Xhtml2pdf ist eine Open-Source-Python-Bibliothek, die für die Konvertierung von HTML-Inhalten in PDF-Dokumente entwickelt wurde, wobei der Schwerpunkt auf der Beibehaltung der ursprünglichen Struktur und des ursprünglichen Stils liegt. Diese leistungsstarke Bibliothek wandelt Webseiten nahtlos in professionelle, druckfertige PDFs um.
Erste Schritte mit xhtml2pdf
Sie benötigen Python Version 3.8.0 oder höher, um xhtml2pdf zu installieren und zu verwenden. Installieren Sie also zuerst Python und verwenden Sie dann die folgenden Befehle, um xhtml2pdf mit pip und virtuelle Umgebung.
Linux
python -m venv env
. env/bin/activate
pip install xhtml2pdf
Mac OS
python -m venv env
. env/bin/activate
pip install xhtml2pdf
Windows
python -m venv env
.\env\Scripts\activate
pip install xhtml2pdf
Konvertieren eines HTML-Strings in ein PDF-Dokument
Mit der xhtml2pdf-Bibliothek können wir einen HTML-String in ein PDF-Dokument konvertieren. Wir speichern den vollständigen HTML-Inhalt in einer Variablen und übergeben diese Variable dann an die Funktion pisa.CreatePDF(html_content, dest,kodierung). Diese Methode stellt uns den PDF-Inhalt zur Verfügung, wobei Hyperlinks, Bilder und andere Elemente in einem BytesIO-Objekt verwaltet werden, das wir an sie übergeben haben. Abschließend erstellen wir eine PDF-Datei mit den im BytesIO-Objekt gespeicherten Daten. Weitere Informationen finden Sie im folgenden Codeausschnitt:
Ausgabe
Der folgende Screenshot zeigt das aus der HTML-Zeichenfolge konvertierte PDF-Dokument:
Konvertieren einer HTML-Datei in ein PDF-Dokument
Wir können eine HTML-Datei auch mithilfe der xhtml2pdf-Bibliothek in eine PDF-Datei konvertieren. Wir lesen den Inhalt der HTML-Datei in eine Variable ein und übergeben diese Variable dann an die Methode pisa.CreatePDF(html_content, dest,kodierung). Danach folgen wir den gleichen Schritten wie im vorherigen Beispiel, um das PDF-Dokument mit dem BytesIO-Objekt zu erstellen, wie im folgenden Codeausschnitt gezeigt:
Ausgabe
Der Screenshot unten zeigt das PDF-Dokument, das aus der HTML-Datei konvertiert wurde:
Abschluss
Zusammenfassend ist xhtml2pdf eine Open-Source-Python-Bibliothek, die HTML in PDF-Dokumente konvertiert und dabei Hyperlinks, Bilder und externe Stylesheets verarbeitet. xhtml2pdf schließt beim Konvertieren von HTML in PDF keine Front-End-Bibliotheken ein. Wenn es also Variablen im HTML wie {{name}} gibt, werden diese im PDF genau so angezeigt, wie sie im HTML geschrieben sind, anstatt ihre tatsächlichen Werte anzuzeigen.
Darüber hinaus fehlt die Unterstützung für dynamische Seiten, die zum Abrufen von Inhalten auf JavaScript angewiesen sind, und es folgt keinen komplexen CSS-spezifizierten Layouts (es wendet beispielsweise die im CSS genannten Farben, Schriftgrößen usw. an, ignoriert aber das Layout-CSS wie Abstände, Ränder, Anzeige usw.). Trotz dieser Einschränkungen bleibt xhtml2pdf ein wertvolles Werkzeug für einfache statische HTML-zu-PDF-Konvertierungsanforderungen.