Bibliothèque de conversion Open Source Python HTML vers PDF
Essayez cette bibliothèque Python gratuite et open source pour convertir des documents HTML en PDF.
Qu’est-ce que xhtml2pdf ?
Xhtml2pdf est une bibliothèque Python open source conçue pour convertir du contenu HTML en documents PDF en mettant l'accent sur la préservation de la structure et du style d'origine. Cette puissante bibliothèque convertit de manière transparente les pages Web en PDF professionnels prêts à imprimer.
Premiers pas avec xhtml2pdf
Vous avez besoin de Python version 3.8.0 ou supérieure pour installer et utiliser xhtml2pdf. Alors, installez d'abord Python, puis utilisez les commandes ci-dessous pour installer xhtml2pdf sur votre machine en utilisant pip et environnement virtuel.
Linux
python -m venv env
. env/bin/activate
pip install xhtml2pdf
Mac OS
python -m venv env
. env/bin/activate
pip install xhtml2pdf
les fenêtres
python -m venv env
.\env\Scripts\activate
pip install xhtml2pdf
Conversion d'une chaîne HTML en document PDF
Nous pouvons convertir une chaîne HTML en document PDF en utilisant la bibliothèque xhtml2pdf. Nous stockons le contenu HTML complet dans une variable, puis transmettons cette variable à la fonction pisa.CreatePDF(html_content, dest, encoding). Cette méthode nous fournit le contenu PDF dans lequel les hyperliens, images et autres éléments sont gérés dans un objet BytesIO que nous lui avons transmis. Enfin, nous créons un fichier PDF en utilisant les données stockées dans l'objet BytesIO. Consultez l'extrait de code ci-dessous pour plus de détails :
Sortir
La capture d'écran ci-dessous affiche le document PDF converti à partir de la chaîne HTML :
Conversion d'un fichier HTML en document PDF
Nous pouvons également convertir un fichier HTML en PDF en utilisant la bibliothèque xhtml2pdf. Nous lisons le contenu du fichier HTML dans une variable, puis transmettons cette variable à la méthode pisa.CreatePDF(html_content, dest, encoding). Après cela, nous suivons les mêmes étapes que celles partagées dans l'exemple précédent pour créer le document PDF à l'aide de l'objet BytesIO, comme démontré dans l'extrait de code ci-dessous :
Sortir
La capture d'écran ci-dessous affiche le document PDF converti à partir du fichier HTML :
Conclusion
En résumé, xhtml2pdf est une bibliothèque Python open source qui convertit les documents HTML en PDF tout en gérant les hyperliens, les images et les feuilles de style externes. xhtml2pdf n'inclut pas de bibliothèques frontales lors de la conversion du HTML en PDF, donc lorsqu'il y a des variables dans le HTML comme {{name}}, elles apparaissent dans le PDF exactement telles qu'elles sont écrites dans le HTML, au lieu d'afficher leurs valeurs réelles.
De plus, il ne prend pas en charge les pages dynamiques qui dépendent de JavaScript pour récupérer le contenu, et il ne suit pas les mises en page complexes spécifiées par CSS (par exemple, il applique les couleurs, les tailles de police, etc. mentionnées dans le CSS mais il ignore la mise en page CSS. tels que les remplissages, la marge, l'affichage, etc.). Malgré ces contraintes, xhtml2pdf reste un outil précieux pour les besoins simples de conversion statique HTML en PDF.