Biblioteka Open Source Python HTML do PDF Conversion
Wypróbuj tę darmową i otwartą bibliotekę Pythona, aby konwertować dokumenty HTML do PDF.
Czym jest xhtml2pdf?
Xhtml2pdf to biblioteka Pythona typu open source zaprojektowana do konwersji treści HTML na dokumenty PDF, której głównym celem jest zachowanie oryginalnej struktury i stylu. Ta potężna biblioteka płynnie konwertuje strony internetowe na profesjonalne pliki PDF gotowe do druku.
Pierwsze kroki z xhtml2pdf
Potrzebujesz wersji Pythona 3.8.0 lub nowszej, aby zainstalować i używać xhtml2pdf. Więc najpierw zainstaluj Python, a następnie użyj poniższych poleceń, aby zainstalować xhtml2pdf na swoim komputerze, używając pip i środowiska wirtualnego.
Linux
python -m venv env
. env/bin/activate
pip install xhtml2pdf
macOS
python -m venv env
. env/bin/activate
pip install xhtml2pdf
Okna
python -m venv env
.\env\Scripts\activate
pip install xhtml2pdf
Konwersja ciągu HTML na dokument PDF
Możemy przekonwertować ciąg HTML na dokument PDF za pomocą biblioteki xhtml2pdf. Przechowujemy całą zawartość HTML w zmiennej, a następnie przekazujemy tę zmienną do funkcji pisa.CreatePDF(html_content, dest, encoding). Ta metoda dostarcza nam zawartość PDF, w której hiperłącza, obrazy i inne elementy są zarządzane w obiekcie BytesIO, który do niej przekazaliśmy. Na koniec tworzymy plik PDF, używając danych przechowywanych w obiekcie BytesIO. Sprawdź poniższy fragment kodu, aby uzyskać szczegóły:
Wyjście
Poniższy zrzut ekranu przedstawia dokument PDF przekonwertowany z ciągu HTML:
Konwersja pliku HTML do dokumentu PDF
Możemy również przekonwertować plik HTML na PDF za pomocą biblioteki xhtml2pdf. Odczytujemy zawartość pliku HTML do zmiennej, a następnie przekazujemy tę zmienną do metody pisa.CreatePDF(html_content, dest, encoding). Następnie wykonujemy te same kroki, które udostępniliśmy w poprzednim przykładzie, aby utworzyć dokument PDF za pomocą obiektu BytesIO, jak pokazano w poniższym fragmencie kodu:
Wyjście
Poniższy zrzut ekranu przedstawia dokument PDF, który został przekonwertowany z pliku HTML:
Wniosek
Podsumowując, xhtml2pdf to biblioteka Pythona o otwartym kodzie źródłowym, która konwertuje dokumenty HTML do PDF, obsługując jednocześnie hiperłącza, obrazy i zewnętrzne arkusze stylów. xhtml2pdf nie obejmuje bibliotek front-end podczas konwersji HTML do PDF, więc jeśli w kodzie HTML znajdują się zmienne, takie jak {{name}}, pojawiają się one w pliku PDF dokładnie tak, jak zostały zapisane w kodzie HTML, zamiast pokazywać ich rzeczywiste wartości.
Ponadto nie obsługuje dynamicznych stron, które zależą od JavaScript w celu pobierania treści, i nie przestrzega skomplikowanych układów określonych przez CSS (na przykład stosuje kolory, rozmiary czcionek itp. wymienione w CSS, ale ignoruje układ CSS, taki jak wypełnienia, marginesy, wyświetlanie itp.). Pomimo tych ograniczeń, xhtml2pdf pozostaje cennym narzędziem do prostych potrzeb konwersji statycznego HTML-do-PDF.