Библиотека преобразования HTML в PDF с открытым исходным кодом на Python
Попробуйте этот бесплатный API Python с открытым исходным кодом в качестве библиотеки преобразования HTML в PDF.
Что такое WeasyPrint?
WeasyPrint — это библиотека Python с открытым исходным кодом и инструмент командной строки, который преобразует файлы HTML и CSS в документы PDF с высококачественной визуализацией, что делает ее универсальным инструментом для создания PDF-файлов из веб-контента. WeasyPrint позволяет конвертировать встроенный HTML-код, локальные HTML-файлы и веб-URL-адреса в документы PDF с помощью одной строки кода.
Краткий список функций, поддерживаемых WeasyPrint, приведен ниже:
- WeasyPrint поддерживает многие спецификации CSS, написанные W3C.
- Он обеспечивает комплексную поддержку URL-адресов, HTML и поддерживаемых тегов HTML.
- WeasyPrint может обрабатывать внешние ресурсы, такие как изображения или таблицы стилей CSS, через сборщик URL-адресов.
- Сборщик по умолчанию может открывать файлы и URL-адреса HTTP.
- Он поддерживает различные функции, связанные с созданием PDF-файлов, включая шрифты, CSS, CSS уровня 2, версия 1, селекторы уровня 3/4 и текст CSS.
Начало работы с WeasyPrint
Для установки и использования WeasyPrint вам потребуется Python версии 3.7.0 или выше. Итак, сначала установите Python, а затем используйте приведенные ниже команды для установки WeasyPrint на свой компьютер с помощью pip и виртуальная среда :
Установить в Linux
python3 -m venv venv
source venv/bin/activate
pip install weasyprint
weasyprint --info
Установите на Ubuntu 20.04 или выше.
apt install python3-pip libpango-1.0-0 libharfbuzz0b libpangoft2-1.0-0 libffi-dev libjpeg-dev libopenjp2-7-dev
Установите на MacOS с помощью Homebrew.
brew install weasyprint
Установить на Windows 11 64-разрядную версию
python3 -m venv venv
venv\Scripts\activate.bat
python3 -m pip install weasyprint
python3 -m weasyprint --info
Примечание. Для установки в Windows установите GTK3 перед запуском вышеуказанных команд.
Преобразование HTML в PDF через веб-URL
Мы можем преобразовать любую веб-страницу HTML в PDF с помощью одной строки кода, используя библиотеку WeasyPrint Python. Нам просто нужно импортировать класс HTML из библиотеки, создать объект класса HTML с URL-адресом веб-сайта и вызвать метод write_pdf, чтобы преобразовать его в документ PDF с нужным именем.
Преобразование HTML в PDF через веб-URL с помощью встроенного CSS
Мы также можем преобразовать URL-адрес веб-сайта в PDF с помощью встроенной таблицы стилей, используя библиотеку WeasyPrint.
Заключение
WeasyPrint — это простая в использовании бесплатная библиотека Python с открытым исходным кодом, которая преобразует HTML и CSS в документы PDF. Вы можете создавать шаблоны на основе HTML для необходимых документов, а затем быстро экспортировать их в PDF. WeasyPrint предоставляет разработчикам гибкие возможности преобразования, позволяя им конвертировать HTML в PDF из URL-адреса веб-сайта, локального файла HTML, строки, содержащей HTML-код, файлового объекта и т. д.
Даже WeasyPrint — отличный бесплатный вариант преобразования HTML в PDF-документы для разработчиков Python, хотя в случае сложной структуры HTML и CSS сгенерированные PDF-документы могут не отображаться с высокой точностью, что может создать проблемы для пользователей со строгими требованиями.