Thư viện hợp nhất Python PDF mã nguồn mở
Thư viện Python mã nguồn mở và miễn phí để phân tách, hợp nhất, thêm, xoay và cắt các trang của tài liệu PDF.
Pypdf là gì?
pypdf là thư viện Python mã nguồn mở và miễn phí, cho phép thực hiện một số thao tác trên tài liệu PDF như thêm, xoay, cắt, tách và hợp nhất các trang của tệp PDF.
Một số tính năng được liệt kê dưới đây:
- Hợp nhất các tệp PDF: Bạn có thể hợp nhất nhiều tài liệu PDF thành một tệp PDF bằng cách sử dụng pypdf. Điều này rất hữu ích để kết hợp các báo cáo PDF, bản trình bày hoặc các tài liệu khác.
- Chia PDF: Pypdf cũng hỗ trợ chia PDF thành nhiều tệp PDF nhỏ hơn. Điều này có thể hữu ích khi bạn muốn chia một tệp PDF lớn thành các phần riêng lẻ.
- Xoay trang: Bạn có thể xoay các trang riêng lẻ trong tài liệu PDF bằng pypdf. Điều này rất hữu ích để sửa hướng của tài liệu hoặc hình ảnh được quét.
Bắt đầu với pypdf
Bạn cần Python phiên bản 3.6.0 trở lên để cài đặt và sử dụng pypdf. Vì vậy, trước tiên hãy cài đặt Python, sau đó sử dụng các lệnh bên dưới để cài đặt pypdf trên máy của bạn bằng cách sử dụng pip và môi trường ảo.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
Hệ điều hành Mac
python -m venv venv
source venv/bin/activate
pip install pypdf
các cửa sổ
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Thêm, xoay và cắt trang PDF
Bạn có thể sử dụng thư viện pypdf trong Python để thao tác với tệp PDF, chẳng hạn như thêm, xoay, cắt trang và thậm chí thêm các tác vụ JavaScript vào tài liệu PDF bằng cách sử dụng các lớp PdfWriter và PdfReader như được hiển thị trong mã dưới đây:
Lưu ý: Chỉ vì nội dung không còn hiển thị nữa nên nó không biến mất. Cắt xén hoạt động bằng cách điều chỉnh hộp xem. Điều đó có nghĩa là nội dung bị cắt bỏ vẫn có thể được khôi phục.
Hợp nhất các tệp PDF
Bạn có thể sử dụng thư viện pypdf trong Python để thao tác với các tệp PDF như hợp nhất nhiều tệp PDF vào một tài liệu. Bạn có thể hợp nhất và thao tác với các tệp PDF bằng cách sử dụng các chức năng của lớp PdfWriter như trong mã bên dưới:
Tách tài liệu PDF
Chúng ta có thể chia tài liệu PDF thành nhiều tài liệu bằng cách sử dụng các chức năng khác nhau của các lớp PdfWriter và PdfReader trong thư viện pypdf. Đoạn mã dưới đây chia tài liệu PDF được cung cấp thành hai nửa và lưu chúng thành hai tệp PDF riêng biệt:
Phần kết luận
Tóm lại, khả năng hợp nhất của pypdf là mẫu mực, thể hiện sự thành thạo của thư viện trong việc xử lý tài liệu PDF. Khả năng kết hợp các tệp PDF một cách dễ dàng của pypdf khiến nó trở thành lựa chọn tuyệt vời cho các tác vụ yêu cầu tập hợp tài liệu, tạo báo cáo hoặc hợp nhất các tài nguyên PDF khác nhau. Các tính năng thân thiện với người dùng và khả năng hợp nhất hiệu quả góp phần tạo nên danh tiếng cho nó như một công cụ có giá trị trong việc quản lý tài liệu PDF.