Libreria di conversione da HTML a PDF Python open source
Prova questa libreria Python gratuita e open source per convertire documenti HTML in PDF.
Cos'è xhtml2pdf?
Xhtml2pdf è una libreria Python open source progettata per convertire contenuti HTML in documenti PDF con l'obiettivo principale di preservare la struttura e lo stile originali. Questa potente libreria converte perfettamente le pagine Web in PDF professionali pronti per la stampa.
Iniziare con xhtml2pdf
È necessaria la versione 3.8.0 di Python o successiva per installare e utilizzare xhtml2pdf. Quindi, installa prima Python e poi usa i comandi seguenti per installare xhtml2pdf sul tuo computer usando pip e ambiente virtuale.
Linux
python -m venv env
. env/bin/activate
pip install xhtml2pdf
Mac OS
python -m venv env
. env/bin/activate
pip install xhtml2pdf
finestre
python -m venv env
.\env\Scripts\activate
pip install xhtml2pdf
Conversione di stringhe HTML in documenti PDF
Possiamo convertire una stringa HTML in un documento PDF utilizzando la libreria xhtml2pdf. Memorizziamo il contenuto HTML completo in una variabile e quindi passiamo tale variabile alla funzione pisa.CreatePDF(html_content, dest, encoding). Questo metodo ci fornisce il contenuto PDF in cui collegamenti ipertestuali, immagini e altri elementi sono gestiti all'interno di un oggetto BytesIO che gli abbiamo passato. Infine, creiamo un file PDF utilizzando i dati memorizzati nell'oggetto BytesIO. Controlla lo snippet di codice qui sotto per i dettagli:
Produzione
Lo screenshot seguente mostra il documento PDF convertito dalla stringa HTML:
Conversione di file HTML in documento PDF
Possiamo anche convertire un file HTML in un PDF utilizzando la libreria xhtml2pdf. Leggiamo il contenuto del file HTML in una variabile e quindi passiamo tale variabile al metodo pisa.CreatePDF(html_content, dest, encoding). Successivamente seguiamo gli stessi passaggi condivisi nell'esempio precedente per creare il documento PDF utilizzando l'oggetto BytesIO come dimostrato nello snippet di codice seguente:
Produzione
Lo screenshot seguente mostra il documento PDF convertito dal file HTML:
Conclusione
In sintesi, xhtml2pdf è una libreria Python open source che converte documenti HTML in PDF gestendo collegamenti ipertestuali, immagini e fogli di stile esterni. xhtml2pdf non include librerie front-end durante la conversione da HTML a PDF, quindi quando sono presenti variabili nell'HTML come {{name}}, appaiono nel PDF esattamente come scritte nell'HTML, invece di mostrare i loro valori effettivi.
Inoltre, manca il supporto per le pagine dinamiche che dipendono da JavaScript per recuperare i contenuti e non segue layout complessi specificati dai CSS (ad esempio, applica i colori, le dimensioni dei caratteri ecc. menzionati nel CSS ma ignora il layout CSS come imbottiture, margine, visualizzazione, ecc.). Nonostante questi vincoli, xhtml2pdf rimane uno strumento prezioso per le semplici esigenze di conversione statica da HTML a PDF.