Бібліотека для перетворення HTML у PDF із відкритим кодом Python
Спробуйте цю безкоштовну бібліотеку Python із відкритим вихідним кодом, щоб конвертувати документи HTML у PDF.
Що таке xhtml2pdf?
Xhtml2pdf — це бібліотека Python з відкритим вихідним кодом, призначена для перетворення вмісту HTML у документи PDF із зосередженням на збереженні оригінальної структури та стилю. Ця потужна бібліотека плавно перетворює веб-сторінки на професійні PDF-файли, готові до друку.
Початок роботи з xhtml2pdf
Для встановлення та використання xhtml2pdf вам потрібна версія Python 3.8.0 або новіша. Отже, спочатку встановіть Python, а потім використовуйте наведені нижче команди, щоб установити xhtml2pdf на ваш комп’ютер за допомогою pip і віртуальне середовище.
Linux
python -m venv env
. env/bin/activate
pip install xhtml2pdf
MacOS
python -m venv env
. env/bin/activate
pip install xhtml2pdf
вікна
python -m venv env
.\env\Scripts\activate
pip install xhtml2pdf
Перетворення рядка HTML на документ PDF
Ми можемо перетворити рядок HTML на документ PDF за допомогою бібліотеки xhtml2pdf. Ми зберігаємо весь HTML-вміст у змінній, а потім передаємо цю змінну функції pisa.CreatePDF(html_content, dest, encoding). Цей метод надає нам PDF-вміст, у якому гіперпосиланнями, зображеннями та іншими елементами керується об’єкт BytesIO, який ми йому передали. Нарешті, ми створюємо файл PDF, використовуючи дані, що зберігаються в об’єкті BytesIO. Подробиці дивіться у фрагменті коду нижче:
На знімку екрана нижче показано PDF-документ, перетворений із рядка HTML:
Перетворення файлу HTML на документ PDF
Ми також можемо конвертувати файл HTML у PDF за допомогою бібліотеки xhtml2pdf. Ми читаємо вміст HTML-файлу в змінну, а потім передаємо цю змінну в метод pisa.CreatePDF(html_content, dest, encoding). Після цього ми виконуємо ті самі дії, що й у попередньому прикладі, щоб створити PDF-документ за допомогою об’єкта BytesIO, як показано у наведеному нижче фрагменті коду:
На знімку екрана нижче показано документ PDF, який було перетворено з файлу HTML:
Висновок
Підсумовуючи, xhtml2pdf — це бібліотека Python з відкритим кодом, яка перетворює HTML-документи на PDF-документи, обробляючи гіперпосилання, зображення та зовнішні таблиці стилів. xhtml2pdf не містить інтерфейсних бібліотек під час перетворення HTML у PDF, тому, коли в HTML є змінні, такі як {{name}}, вони відображаються в PDF-файлі точно так, як написано в HTML, замість того, щоб показувати їхні фактичні значення.
Крім того, він не підтримує динамічні сторінки, які залежать від JavaScript для отримання вмісту, і він не дотримується складних макетів, визначених CSS (наприклад, він застосовує кольори, розміри шрифтів тощо, згадані в CSS, але ігнорує макет CSS наприклад відступи, поля, дисплей тощо). Незважаючи на ці обмеження, xhtml2pdf залишається цінним інструментом для простого статичного перетворення HTML у PDF.