Biblioteka Open Source do konwersji HTML do PDF w Pythonie
Wypróbuj ten darmowy i otwarty interfejs API języka Python jako bibliotekę do konwersji HTML do PDF.
Czym jest WeasyPrint?
WeasyPrint to biblioteka Pythona typu open source i narzędzie wiersza poleceń, które konwertuje pliki HTML i CSS na dokumenty PDF z wysokiej jakości renderowaniem, co czyni je wszechstronnym narzędziem do generowania plików PDF z treści internetowych. WeasyPrint umożliwia konwersję kodu HTML inline, lokalnych plików HTML i adresów URL stron internetowych na dokumenty PDF za pomocą jednej linii kodu.
Poniżej znajduje się krótka lista funkcji obsługiwanych przez WeasyPrint:
- WeasyPrint obsługuje wiele specyfikacji CSS opracowanych przez W3C.
- Zapewnia kompleksowe wsparcie dla adresów URL, języka HTML i obsługiwanych tagów HTML.
- WeasyPrint może obsługiwać zasoby zewnętrzne, takie jak obrazy lub arkusze stylów CSS, za pomocą modułu pobierania adresów URL.
- Domyślny moduł pobierania może otwierać pliki i adresy URL HTTP.
- Obsługuje różne funkcje związane z generowaniem plików PDF, w tym czcionki, CSS, CSS Level 2 Revision 1, Selectors Level 3/4 i CSS Text.
Pierwsze kroki z WeasyPrint
Potrzebujesz wersji Pythona 3.7.0 lub nowszej, aby zainstalować i używać WeasyPrint. Więc najpierw zainstaluj Python, a następnie użyj poniższych poleceń, aby zainstalować WeasyPrint na swoim komputerze, używając pip i środowiska wirtualnego:
Zainstaluj na Linuksie
python3 -m venv venv
source venv/bin/activate
pip install weasyprint
weasyprint --info
Zainstaluj na Ubuntu 20.04 lub nowszym
apt install python3-pip libpango-1.0-0 libharfbuzz0b libpangoft2-1.0-0 libffi-dev libjpeg-dev libopenjp2-7-dev
Zainstaluj na MacOS przy użyciu Homebrew
brew install weasyprint
Zainstaluj w systemie Windows 11 64-bit
python3 -m venv venv
venv\Scripts\activate.bat
python3 -m pip install weasyprint
python3 -m weasyprint --info
Uwaga: aby przeprowadzić instalację w systemie Windows, zainstaluj GTK3 przed uruchomieniem powyższych poleceń.
Konwertuj HTML do PDF za pomocą adresu URL
Możemy przekonwertować dowolną stronę internetową HTML na PDF za pomocą jednej linii kodu, używając biblioteki Python WeasyPrint. Musimy tylko zaimportować klasę HTML z biblioteki, utworzyć obiekt klasy HTML z adresem URL witryny i wywołać metodę write_pdf, aby przekonwertować go na dokument PDF o żądanej nazwie.
Konwertuj HTML do PDF za pomocą adresu URL z wbudowanym CSS
Możemy również przekonwertować adres URL witryny do formatu PDF z wbudowanym arkuszem stylów, korzystając z biblioteki WeasyPrint.
Wniosek
WeasyPrint to prosta w użyciu, darmowa i otwarta biblioteka Pythona, która konwertuje HTML i CSS na dokumenty PDF. Możesz tworzyć szablony oparte na HTML dla wymaganych dokumentów, a następnie szybko eksportować je do PDF. WeasyPrint daje programistom elastyczne opcje konwersji, umożliwiając im konwersję HTML na PDF z adresu URL witryny, lokalnego pliku HTML, ciągu zawierającego kod HTML i obiektu pliku itp.
Nawet WeasyPrint jest świetną, darmową opcją konwersji dokumentów HTML do PDF dla programistów Pythona, jednak w przypadku złożonej struktury HTML i CSS, wygenerowane dokumenty PDF mogą nie być renderowane z wysoką jakością, co może stwarzać problemy użytkownikom o wysokich wymaganiach.