Thư viện chuyển đổi HTML sang PDF mã nguồn mở bằng Python
Hãy dùng thử API Python mã nguồn mở và miễn phí này dưới dạng thư viện chuyển đổi HTML sang PDF.
WeeasyPrint là gì?
WeeasyPrint là thư viện Python mã nguồn mở và công cụ dòng lệnh giúp chuyển đổi các tệp HTML và CSS thành tài liệu PDF với khả năng hiển thị chất lượng cao, biến nó thành một công cụ linh hoạt để tạo tệp PDF từ nội dung web. WeeasyPrint cho phép chuyển đổi mã HTML nội tuyến, tệp HTML cục bộ và URL web sang tài liệu PDF chỉ bằng một dòng mã.
Dưới đây là danh sách ngắn gọn các tính năng được WeasyPrint hỗ trợ:
- WeeasyPrint hỗ trợ nhiều thông số CSS do W3C viết.
- Nó cung cấp hỗ trợ toàn diện cho URL, HTML và các thẻ HTML được hỗ trợ.
- WeeasyPrint có thể xử lý các tài nguyên bên ngoài như hình ảnh hoặc bảng định kiểu CSS thông qua trình tìm nạp URL.
- Trình tìm nạp mặc định có thể mở tệp và URL HTTP.
- Nó hỗ trợ nhiều tính năng khác nhau liên quan đến việc tạo PDF, bao gồm phông chữ, CSS, CSS Cấp 2 Bản sửa đổi 1, Bộ chọn Cấp 3/4 và Văn bản CSS.
Bắt đầu với WeeasyPrint
Bạn cần Python phiên bản 3.7.0 trở lên để cài đặt và sử dụng WeasyPrint. Vì vậy, trước tiên hãy cài đặt Python, sau đó sử dụng các lệnh bên dưới để cài đặt WeasyPrint trên máy của bạn bằng cách sử dụng pip và môi trường ảo:
Cài đặt trên Linux
python3 -m venv venv
source venv/bin/activate
pip install weasyprint
weasyprint --info
Cài đặt trên Ubuntu 20.04 trở lên
apt install python3-pip libpango-1.0-0 libharfbuzz0b libpangoft2-1.0-0 libffi-dev libjpeg-dev libopenjp2-7-dev
Cài đặt trên MacOS bằng Homebrew
brew install weasyprint
Cài đặt trên Windows 11 64-bit
python3 -m venv venv
venv\Scripts\activate.bat
python3 -m pip install weasyprint
python3 -m weasyprint --info
Lưu ý: Để cài đặt trên Windows, hãy cài đặt GTK3 trước khi chạy các lệnh trên.
Chuyển đổi HTML sang PDF qua URL Web
Chúng tôi có thể chuyển đổi bất kỳ trang web HTML nào sang PDF chỉ bằng một dòng mã bằng thư viện WeasyPrint Python. Chúng ta chỉ cần nhập lớp HTML từ thư viện, tạo một đối tượng của lớp HTML với URL trang web và gọi phương thức write_pdf để chuyển đổi nó thành tài liệu PDF với tên mong muốn.
Chuyển đổi HTML sang PDF qua URL Web bằng CSS nội tuyến
Chúng tôi cũng có thể chuyển đổi URL trang web sang PDF bằng biểu định kiểu nội tuyến bằng thư viện WeasyPrint.
Phần kết luận
WeeasyPrint là thư viện Python mã nguồn mở và miễn phí dễ sử dụng để chuyển đổi tài liệu HTML và CSS sang PDF. Bạn có thể tạo các mẫu dựa trên HTML cho các tài liệu cần thiết và sau đó nhanh chóng xuất chúng sang PDF. WeeasyPrint cung cấp các tùy chọn chuyển đổi linh hoạt cho nhà phát triển bằng cách cho phép họ chuyển đổi HTML sang PDF từ URL trang web, tệp HTML cục bộ, chuỗi chứa mã HTML và đối tượng tệp, v.v.
Ngay cả WeasyPrint cũng là một tùy chọn miễn phí tuyệt vời để chuyển đổi tài liệu HTML sang PDF dành cho nhà phát triển Python, mặc dù trong trường hợp cấu trúc HTML & CSS phức tạp, tài liệu PDF được tạo có thể không hiển thị ở độ trung thực cao, điều này có thể gây ra sự cố cho người dùng có yêu cầu nghiêm ngặt.