Thư viện chuyển đổi Python HTML sang PDF mã nguồn mở
Hãy dùng thử thư viện Python mã nguồn mở và miễn phí này để chuyển đổi tài liệu HTML sang PDF.
xhtml2pdf là gì?
Xhtml2pdf là thư viện Python mã nguồn mở được thiết kế để chuyển đổi nội dung HTML sang tài liệu PDF với trọng tâm chính là giữ nguyên cấu trúc và kiểu dáng ban đầu. Thư viện mạnh mẽ này chuyển đổi liền mạch các trang web thành các tệp PDF sẵn sàng in chuyên nghiệp.
Bắt đầu với xhtml2pdf
Bạn cần Python phiên bản 3.8.0 trở lên để cài đặt và sử dụng xhtml2pdf. Vì vậy, trước tiên hãy cài đặt Python, sau đó sử dụng các lệnh bên dưới để cài đặt xhtml2pdf trên máy của bạn bằng cách sử dụng pip và môi trường ảo.
Linux
python -m venv env
. env/bin/activate
pip install xhtml2pdf
Hệ điều hành Mac
python -m venv env
. env/bin/activate
pip install xhtml2pdf
các cửa sổ
python -m venv env
.\env\Scripts\activate
pip install xhtml2pdf
Chuyển đổi chuỗi HTML thành tài liệu PDF
Chúng ta có thể chuyển đổi chuỗi HTML thành tài liệu PDF bằng thư viện xhtml2pdf. Chúng tôi lưu trữ nội dung HTML hoàn chỉnh trong một biến rồi chuyển biến đó cho hàm pisa.CreatePDF(html_content, dest,coding). Phương pháp này cung cấp cho chúng tôi nội dung PDF trong đó siêu liên kết, hình ảnh và các thành phần khác được quản lý trong đối tượng BytesIO mà chúng tôi đã chuyển cho nó. Cuối cùng, chúng tôi tạo một tệp PDF bằng cách sử dụng dữ liệu được lưu trữ trong đối tượng BytesIO. Kiểm tra đoạn mã dưới đây để biết chi tiết:
đầu ra
Ảnh chụp màn hình bên dưới hiển thị tài liệu PDF được chuyển đổi từ chuỗi HTML:
Chuyển đổi tệp HTML thành tài liệu PDF
Chúng tôi cũng có thể chuyển đổi tệp HTML thành PDF bằng thư viện xhtml2pdf. Chúng tôi đọc nội dung tệp HTML thành một biến rồi chuyển biến đó sang phương thức pisa.CreatePDF(html_content, dest,coding). Sau đó, chúng ta làm theo các bước tương tự như đã chia sẻ trong ví dụ trước để tạo tài liệu PDF bằng cách sử dụng đối tượng BytesIO như minh họa trong đoạn mã bên dưới:
đầu ra
Ảnh chụp màn hình bên dưới hiển thị tài liệu PDF được chuyển đổi từ tệp HTML:
Phần kết luận
Tóm lại, xhtml2pdf là thư viện Python mã nguồn mở giúp chuyển đổi tài liệu HTML sang PDF trong khi xử lý các siêu liên kết, hình ảnh và biểu định kiểu bên ngoài. xhtml2pdf không bao gồm các thư viện giao diện người dùng khi chuyển đổi HTML sang PDF, vì vậy khi có các biến trong HTML như {{name}}, chúng sẽ xuất hiện trong PDF chính xác như được viết bằng HTML, thay vì hiển thị giá trị thực của chúng.
Ngoài ra, nó thiếu hỗ trợ cho các trang động phụ thuộc vào JavaScript để tìm nạp nội dung và không tuân theo các bố cục phức tạp do CSS chỉ định (ví dụ: nó áp dụng màu sắc, kích thước phông chữ, v.v. được đề cập trong CSS nhưng nó bỏ qua CSS bố cục chẳng hạn như phần đệm, lề, hiển thị, v.v.). Bất chấp những hạn chế này, xhtml2pdf vẫn là một công cụ có giá trị cho nhu cầu chuyển đổi HTML sang PDF tĩnh đơn giản.