Biblioteka konwersji Open Source Python HTML na PDF
Wypróbuj tę bezpłatną i otwartą bibliotekę Pythona, aby konwertować dokumenty HTML na PDF.
Co to jest xhtml2pdf?
Xhtml2pdf to biblioteka Pythona o otwartym kodzie źródłowym, przeznaczona do konwertowania treści HTML na dokumenty PDF, ze szczególnym naciskiem na zachowanie oryginalnej struktury i stylu. Ta potężna biblioteka płynnie konwertuje strony internetowe do profesjonalnych plików PDF gotowych do druku.
Pierwsze kroki z xhtml2pdf
Aby zainstalować i używać xhtml2pdf, potrzebujesz Pythona w wersji 3.8.0 lub nowszej. Zatem najpierw zainstaluj Python, a następnie użyj poniższych poleceń, aby zainstalować xhtml2pdf na swoim komputerze za pomocą pip i środowisko wirtualne.
Linuksa
python -m venv env
. env/bin/activate
pip install xhtml2pdf
System operacyjny Mac
python -m venv env
. env/bin/activate
pip install xhtml2pdf
Okna
python -m venv env
.\env\Scripts\activate
pip install xhtml2pdf
Konwersja ciągu HTML na dokument PDF
Możemy przekonwertować ciąg HTML na dokument PDF za pomocą biblioteki xhtml2pdf. Przechowujemy całą treść HTML w zmiennej, a następnie przekazujemy tę zmienną do funkcji pisa.CreatePDF(html_content, dest, encoding). Ta metoda zapewnia zawartość PDF, w której hiperłącza, obrazy i inne elementy są zarządzane w ramach przekazanego do niej obiektu BytesIO. Na koniec tworzymy plik PDF wykorzystując dane zapisane w obiekcie BytesIO. Sprawdź poniższy fragment kodu, aby poznać szczegóły:
Poniższy zrzut ekranu przedstawia dokument PDF przekonwertowany z ciągu HTML:
Konwersja pliku HTML na dokument PDF
Możemy również przekonwertować plik HTML na plik PDF za pomocą biblioteki xhtml2pdf. Wczytujemy zawartość pliku HTML do zmiennej, a następnie przekazujemy tę zmienną do metody pisa.CreatePDF(html_content, dest, encoding). Następnie wykonujemy te same kroki, co w poprzednim przykładzie, aby utworzyć dokument PDF przy użyciu obiektu BytesIO, jak pokazano w poniższym fragmencie kodu:
Poniższy zrzut ekranu przedstawia dokument PDF przekonwertowany z pliku HTML:
Wniosek
Podsumowując, xhtml2pdf to biblioteka Pythona typu open source, która konwertuje dokumenty HTML na PDF, jednocześnie obsługując hiperłącza, obrazy i zewnętrzne arkusze stylów. xhtml2pdf nie zawiera bibliotek front-end podczas konwersji HTML do formatu PDF, więc jeśli w kodzie HTML znajdują się zmienne, takie jak {{name}}, pojawiają się one w pliku PDF dokładnie tak, jak są zapisane w kodzie HTML, zamiast pokazywać ich rzeczywiste wartości.
Ponadto nie obsługuje dynamicznych stron, których zawartość zależy od JavaScriptu i nie przestrzega skomplikowanych układów określonych przez CSS (na przykład stosuje kolory, rozmiary czcionek itp. wspomniane w CSS, ale ignoruje CSS układu takie jak dopełnienie, margines, wyświetlacz itp.). Pomimo tych ograniczeń, xhtml2pdf pozostaje cennym narzędziem spełniającym proste potrzeby konwersji statycznego HTML na PDF.