Thư viện chuyển đổi HTML sang PDF nguồn mở bằng Python
Hãy thử API Python mã nguồn mở miễn phí này như một thư viện chuyển đổi HTML sang PDF.
WeasyPrint là gì?
WeasyPrint là một thư viện Python mã nguồn mở và công cụ dòng lệnh chuyển đổi các tệp HTML và CSS thành tài liệu PDF với chất lượng kết xuất cao, biến nó thành một công cụ đa năng để tạo PDF từ nội dung web. WeasyPrint cho phép chuyển đổi mã HTML nội tuyến, tệp HTML cục bộ và URL web thành tài liệu PDF chỉ bằng một dòng mã.
Dưới đây là danh sách tóm tắt các tính năng được WeasyPrint hỗ trợ:
- WeasyPrint hỗ trợ nhiều thông số kỹ thuật CSS do W3C viết.
- Nó cung cấp hỗ trợ toàn diện cho URL, HTML và các thẻ HTML được hỗ trợ.
- WeasyPrint có thể xử lý các tài nguyên bên ngoài như hình ảnh hoặc bảng định dạng CSS thông qua trình truy xuất URL.
- Trình tải xuống mặc định có thể mở tệp và URL HTTP.
- Nó hỗ trợ nhiều tính năng liên quan đến việc tạo PDF, bao gồm phông chữ, CSS, CSS Cấp độ 2 Bản sửa đổi 1, Bộ chọn Cấp độ 3/4 và Văn bản CSS.
Bắt đầu với WeasyPrint
Bạn cần Python phiên bản 3.7.0 trở lên để cài đặt và sử dụng WeasyPrint. Vì vậy, trước tiên hãy cài đặt Python rồi sử dụng các lệnh bên dưới để cài đặt WeasyPrint trên máy của bạn bằng pip và môi trường ảo:
Cài đặt trên Linux
python3 -m venv venv
source venv/bin/activate
pip install weasyprint
weasyprint --info
Cài đặt trên Ubuntu 20.04 hoặc cao hơn
apt install python3-pip libpango-1.0-0 libharfbuzz0b libpangoft2-1.0-0 libffi-dev libjpeg-dev libopenjp2-7-dev
Cài đặt trên MacOS bằng Homebrew
brew install weasyprint
Cài đặt trên Windows 11 64-bit
python3 -m venv venv
venv\Scripts\activate.bat
python3 -m pip install weasyprint
python3 -m weasyprint --info
Lưu ý: Để cài đặt trên Windows, hãy cài đặt GTK3 trước khi chạy các lệnh trên.
Chuyển đổi HTML sang PDF thông qua URL Web
Chúng ta có thể chuyển đổi bất kỳ trang web HTML nào sang PDF chỉ bằng một dòng mã bằng thư viện WeasyPrint Python. Chúng ta chỉ cần import lớp HTML từ thư viện, tạo một đối tượng của lớp HTML với URL trang web và gọi phương thức write_pdf để chuyển đổi thành tài liệu PDF với tên mong muốn.
Chuyển đổi HTML sang PDF thông qua URL Web bằng Inline CSS
Chúng ta cũng có thể chuyển đổi URL trang web sang PDF bằng bảng định dạng nội tuyến bằng thư viện WeasyPrint.
Phần kết luận
WeasyPrint là một thư viện Python miễn phí và mã nguồn mở dễ sử dụng, chuyển đổi HTML và CSS sang tài liệu PDF. Bạn có thể tạo các mẫu dựa trên HTML cho các tài liệu cần thiết và sau đó nhanh chóng xuất chúng sang PDF. WeasyPrint cung cấp các tùy chọn chuyển đổi linh hoạt cho các nhà phát triển bằng cách cho phép họ chuyển đổi HTML sang PDF từ URL trang web, tệp HTML cục bộ, chuỗi chứa mã HTML và đối tượng tệp, v.v.
Ngay cả WeasyPrint cũng là một lựa chọn miễn phí tuyệt vời để chuyển đổi tài liệu HTML sang PDF cho các nhà phát triển Python mặc dù trong trường hợp cấu trúc HTML & CSS phức tạp, tài liệu PDF được tạo ra có thể không hiển thị ở độ trung thực cao, điều này có thể gây ra sự cố cho người dùng có yêu cầu khắt khe.