Biblioteca de conversión de HTML a PDF de Python de código abierto

Pruebe esta biblioteca Python gratuita y de código abierto para convertir documentos HTML a PDF.

¿Qué es xhtml2pdf?

Xhtml2pdf es una biblioteca Python de código abierto diseñada para convertir contenido HTML a documentos PDF con un enfoque principal en preservar la estructura y el estilo originales. Esta potente biblioteca convierte sin problemas páginas web en archivos PDF profesionales listos para imprimir.

GitHub

Estadísticas de GitHub

Nombre:
Idioma:
Estrellas:
Tenedores:
Licencia:
El repositorio se actualizó por última vez en

Primeros pasos con xhtml2pdf

Necesita la versión 3.8.0 o superior de Python para instalar y utilizar xhtml2pdf. Entonces, primero instale Python y luego use los siguientes comandos para instalar xhtml2pdf en su máquina usando pip y entorno virtual.

linux


python -m venv env
. env/bin/activate
pip install xhtml2pdf

Mac OS


python -m venv env
. env/bin/activate
pip install xhtml2pdf

ventanas


python -m venv env
.\env\Scripts\activate
pip install xhtml2pdf

Conversión de cadena HTML a documento PDF

Podemos convertir una cadena HTML en un documento PDF usando la biblioteca xhtml2pdf. Almacenamos el contenido HTML completo en una variable y luego pasamos esa variable a la función pisa.CreatePDF(html_content, dest, encoding). Este método nos proporciona el contenido PDF donde los hipervínculos, imágenes y otros elementos se administran dentro de un objeto BytesIO que le pasamos. Finalmente, creamos un archivo PDF usando los datos almacenados en el objeto BytesIO. Consulte el siguiente fragmento de código para obtener más detalles:

Producción

La siguiente captura de pantalla muestra el documento PDF convertido a partir de la cadena HTML:

Convertir un archivo HTML a un documento PDF

También podemos convertir un archivo HTML a PDF usando la biblioteca xhtml2pdf. Leemos el contenido del archivo HTML en una variable y luego pasamos esa variable al método pisa.CreatePDF(html_content, dest, encoding). Después de eso, seguimos los mismos pasos que compartimos en el ejemplo anterior para crear el documento PDF usando el objeto BytesIO como se demuestra en el siguiente fragmento de código:

Producción

La siguiente captura de pantalla muestra el documento PDF que se convirtió desde el archivo HTML:

Conclusión

En resumen, xhtml2pdf es una biblioteca Python de código abierto que convierte documentos HTML a PDF mientras maneja hipervínculos, imágenes y hojas de estilo externas. xhtml2pdf no incluye bibliotecas de interfaz al convertir HTML a PDF, por lo que cuando hay variables en HTML como {{name}}, aparecen en el PDF exactamente como están escritas en HTML, en lugar de mostrar sus valores reales.

Además, carece de soporte para páginas dinámicas que dependen de JavaScript para recuperar contenido y no sigue diseños complejos especificados por CSS (por ejemplo, aplica los colores, tamaños de fuente, etc. mencionados en el CSS pero ignora el diseño CSS). como rellenos, márgenes, visualización, etc.). A pesar de estas limitaciones, xhtml2pdf sigue siendo una herramienta valiosa para las necesidades sencillas de conversión estática de HTML a PDF.

Productos Similares

 Español