Bibliotecă de conversie HTML în PDF cu sursă deschisă în Python
Încercați acest API Python gratuit și cu sursă deschisă ca bibliotecă de conversie HTML în PDF.
Ce este WeasyPrint?
WeasyPrint este o bibliotecă Python open-source și un instrument de linie de comandă care convertește fișierele HTML și CSS în documente PDF cu randare de înaltă calitate, făcându-l un instrument versatil pentru generarea de PDF-uri din conținut web. WeasyPrint permite convertirea codului HTML inline, a fișierelor HTML locale și a adreselor URL web în documente PDF cu o singură linie de cod.
O listă scurtă de funcții acceptate de WeasyPrint sunt enumerate mai jos:
- WeasyPrint acceptă multe dintre specificațiile CSS scrise de W3C.
- Oferă suport complet pentru adrese URL, HTML și etichete HTML acceptate.
- WeasyPrint poate gestiona resurse externe, cum ar fi imagini sau foi de stil CSS, printr-un instrument de preluare a adreselor URL.
- Preluarea implicită poate deschide fișiere și adrese URL HTTP.
- Acceptă diverse funcții legate de generarea PDF, inclusiv fonturi, CSS, CSS Nivelul 2 Revizia 1, Selectorii Nivelul 3/4 și Textul CSS.
Noțiuni introductive cu WeasyPrint
Aveți nevoie de versiunea Python 3.7.0 sau o versiune ulterioară pentru a instala și utiliza WeasyPrint. Deci, mai întâi instalați Python și apoi utilizați comenzile de mai jos pentru a instala WeasyPrint pe computer folosind pip și mediu virtual:
Instalați pe Linux
python3 -m venv venv
source venv/bin/activate
pip install weasyprint
weasyprint --info
Instalați pe Ubuntu 20.04 sau o versiune ulterioară
apt install python3-pip libpango-1.0-0 libharfbuzz0b libpangoft2-1.0-0 libffi-dev libjpeg-dev libopenjp2-7-dev
Instalați pe MacOS folosind Homebrew
brew install weasyprint
Instalați pe Windows 11 pe 64 de biți
python3 -m venv venv
venv\Scripts\activate.bat
python3 -m pip install weasyprint
python3 -m weasyprint --info
Notă: pentru instalare pe Windows, instalați GTK3 înainte de a rula comenzile de mai sus.
Convertiți HTML în PDF prin URL-ul Web
Putem converti orice pagină web HTML în PDF cu o singură linie de cod folosind biblioteca WeasyPrint Python. Trebuie doar să importăm clasa HTML din bibliotecă, să creăm un obiect de clasă HTML cu o adresă URL a site-ului web și să apelăm la metoda write_pdf pentru a o converti în document PDF cu un nume dorit.
Convertiți HTML în PDF prin URL-ul Web cu CSS inline
De asemenea, putem converti adresa URL a unui site web în PDF cu foaia de stil inline folosind biblioteca WeasyPrint.
Concluzie
WeasyPrint este o bibliotecă Python gratuită și open source simplu de utilizat, care convertește HTML și CSS în documente PDF. Puteți crea șabloane bazate pe HTML pentru documentele necesare și apoi le puteți exporta rapid în PDF. WeasyPrint oferă dezvoltatorilor opțiuni de conversie flexibile, permițându-le să convertească HTML în PDF de la adresa URL a unui site web, fișier HTML local, șir care conține cod HTML și obiect de fișier etc.
Chiar și WeasyPrint este o opțiune gratuită excelentă de conversie a documentelor HTML în PDF pentru dezvoltatorii Python, deși în cazul unei structuri HTML și CSS complexe, documentele PDF generate pot să nu fie redate la o fidelitate ridicată, ceea ce poate crea probleme pentru utilizatorii cu cerințe stricte.