Biblioteka konwersji Open Source HTML na PDF w Pythonie
Wypróbuj ten bezpłatny i otwarty interfejs API języka Python jako bibliotekę konwersji HTML na PDF.
Co to jest WeasyPrint?
WeasyPrint to biblioteka Pythona typu open source i narzędzie wiersza poleceń, które konwertuje pliki HTML i CSS na dokumenty PDF z wysokiej jakości renderowaniem, co czyni go wszechstronnym narzędziem do generowania plików PDF z treści internetowych. WeasyPrint umożliwia konwersję wbudowanego kodu HTML, lokalnych plików HTML i internetowych adresów URL do dokumentów PDF za pomocą jednej linii kodu.
Poniżej znajduje się krótka lista funkcji obsługiwanych przez WeasyPrint:
- WeasyPrint obsługuje wiele specyfikacji CSS napisanych przez W3C.
- Zapewnia kompleksową obsługę adresów URL, HTML i obsługiwanych tagów HTML.
- WeasyPrint może obsługiwać zasoby zewnętrzne, takie jak obrazy lub arkusze stylów CSS, za pośrednictwem modułu pobierania adresów URL.
- Domyślny moduł pobierający może otwierać pliki i adresy URL HTTP.
- Obsługuje różne funkcje związane z generowaniem plików PDF, w tym czcionki, CSS, CSS poziom 2 wersja 1, selektory poziomu 3/4 i tekst CSS.
Pierwsze kroki z WeasyPrint
Aby zainstalować i używać WeasyPrint, potrzebujesz języka Python w wersji 3.7.0 lub nowszej. Zatem najpierw zainstaluj Python, a następnie użyj poniższych poleceń, aby zainstalować WeasyPrint na swoim komputerze za pomocą pip i środowisko wirtualne:
Zainstaluj na Linuksie
python3 -m venv venv
source venv/bin/activate
pip install weasyprint
weasyprint --info
Zainstaluj na Ubuntu 20.04 lub nowszym
apt install python3-pip libpango-1.0-0 libharfbuzz0b libpangoft2-1.0-0 libffi-dev libjpeg-dev libopenjp2-7-dev
Zainstaluj na MacOS przy użyciu Homebrew
brew install weasyprint
Zainstaluj w systemie Windows 11 64-bitowym
python3 -m venv venv
venv\Scripts\activate.bat
python3 -m pip install weasyprint
python3 -m weasyprint --info
Uwaga: w przypadku instalacji w systemie Windows zainstaluj GTK3 przed uruchomieniem powyższych poleceń.
Konwertuj HTML na PDF poprzez adres URL
Możemy przekonwertować dowolną stronę internetową HTML na format PDF za pomocą jednej linii kodu, korzystając z biblioteki WeasyPrint Python. Wystarczy zaimportować klasę HTML z biblioteki, utworzyć obiekt klasy HTML z adresem URL witryny i wywołać metodę write_pdf, aby przekonwertować ją na dokument PDF o żądanej nazwie.
Konwertuj HTML na PDF za pośrednictwem adresu URL za pomocą wbudowanego CSS
Możemy również przekonwertować adres URL witryny do formatu PDF za pomocą wbudowanego arkusza stylów przy użyciu biblioteki WeasyPrint.
Wniosek
WeasyPrint to prosta w użyciu, bezpłatna biblioteka Pythona o otwartym kodzie źródłowym, która konwertuje HTML i CSS na dokumenty PDF. Możesz tworzyć szablony oparte na HTML dla wymaganych dokumentów, a następnie szybko eksportować je do formatu PDF. WeasyPrint zapewnia programistom elastyczne opcje konwersji, umożliwiając im konwersję HTML na PDF z adresu URL witryny, lokalnego pliku HTML, ciągu zawierającego kod HTML i obiektu pliku itp.
Nawet WeasyPrint to świetna, bezpłatna opcja konwersji dokumentów HTML na PDF dla programistów Pythona, jednak w przypadku złożonej struktury HTML i CSS wygenerowane dokumenty PDF mogą nie być renderowane z wysoką jakością, co może powodować problemy dla użytkowników o rygorystycznych wymaganiach.