Bibliothèque de conversion HTML en PDF Open Source Python

Essayez cette bibliothèque Python gratuite et open source pour convertir des documents HTML en documents PDF.

Qu'est-ce que xhtml2pdf ?

Xhtml2pdf est une bibliothèque Python open source conçue pour convertir du contenu HTML en documents PDF, en mettant l'accent sur la préservation de la structure et du style d'origine. Cette puissante bibliothèque convertit de manière transparente les pages Web en fichiers PDF professionnels prêts à imprimer.

GitHub

Statistiques GitHub

Nom:
Langue:
Étoiles:
Fourchettes:
Licence:
Le référentiel a été mis à jour pour la dernière fois à

Premiers pas avec xhtml2pdf

Vous avez besoin de la version 3.8.0 ou supérieure de Python pour installer et utiliser xhtml2pdf. Commencez donc par installer Python, puis utilisez les commandes ci-dessous pour installer xhtml2pdf sur votre machine à l'aide de pip et de l'environnement virtuel.

Linux


python -m venv env
. env/bin/activate
pip install xhtml2pdf

MacOS


python -m venv env
. env/bin/activate
pip install xhtml2pdf

Fenêtres


python -m venv env
.\env\Scripts\activate
pip install xhtml2pdf

Conversion d'une chaîne HTML en document PDF

Nous pouvons convertir une chaîne HTML en document PDF en utilisant la bibliothèque xhtml2pdf. Nous stockons le contenu HTML complet dans une variable, puis nous transmettons cette variable à la fonction pisa.CreatePDF(html_content, dest, encoding). Cette méthode nous fournit le contenu PDF dans lequel les hyperliens, les images et les autres éléments sont gérés dans un objet BytesIO que nous lui avons transmis. Enfin, nous créons un fichier PDF en utilisant les données stockées dans l'objet BytesIO. Consultez l'extrait de code ci-dessous pour plus de détails :

Sortir

La capture d'écran ci-dessous affiche le document PDF converti à partir de la chaîne HTML :

Conversion d'un fichier HTML en document PDF

Nous pouvons également convertir un fichier HTML en PDF à l'aide de la bibliothèque xhtml2pdf. Nous lisons le contenu du fichier HTML dans une variable, puis nous passons cette variable à la méthode pisa.CreatePDF(html_content, dest, encoding). Après cela, nous suivons les mêmes étapes que celles que nous avons partagées dans l'exemple précédent pour créer le document PDF à l'aide de l'objet BytesIO comme illustré dans l'extrait de code ci-dessous :

Sortir

La capture d'écran ci-dessous affiche le document PDF qui a été converti à partir du fichier HTML :

Conclusion

En résumé, xhtml2pdf est une bibliothèque Python open source qui convertit les documents HTML en PDF tout en gérant les hyperliens, les images et les feuilles de style externes. xhtml2pdf n'inclut pas de bibliothèques frontales lors de la conversion de HTML en PDF, donc lorsqu'il y a des variables dans le HTML comme {{name}}, elles apparaissent dans le PDF exactement comme écrites dans le HTML, au lieu d'afficher leurs valeurs réelles.

De plus, il ne prend pas en charge les pages dynamiques qui dépendent de JavaScript pour récupérer le contenu, et il ne suit pas les mises en page complexes spécifiées par CSS (par exemple, il applique les couleurs, les tailles de police, etc. mentionnées dans le CSS, mais il ignore le CSS de mise en page tel que les remplissages, les marges, l'affichage, etc.). Malgré ces contraintes, xhtml2pdf reste un outil précieux pour les besoins simples de conversion HTML statique en PDF.

Produits Similaires

 Français