Thư viện JavaScript miễn phí để quản lý siêu dữ liệu PDF
Thư viện JavaScript mã nguồn mở và miễn phí để quản lý siêu dữ liệu của tài liệu PDF.
Pd-lib là gì?
Pdf-lib là một thư viện JavaScript mã nguồn mở và miễn phí để làm việc với các tài liệu PDF để thực hiện các thao tác như tạo PDF mới từ đầu, sửa đổi các PDF hiện có hoặc đọc và cập nhật siêu dữ liệu của các tài liệu PDF. Chúng tôi đã thảo luận về các tính năng chỉnh sửa PDF của pdf-lib nhưng trong bài đánh giá này, chúng tôi sẽ chỉ tập trung vào các tính năng quản lý siêu dữ liệu của pdf-lib bao gồm:
- Tác giả
- Người sáng tạo
- Nhà sản xuất
- Tiêu đề
- Chủ thể
- Từ khóa
- Ngôn ngữ
- Ngày tạo
- Ngày sửa đổi
- Cập nhật siêu dữ liệu: Bạn cũng có thể cập nhật siêu dữ liệu ở trên của tài liệu PDF bằng pdf-lib.
Bắt đầu với pdf-lib
Có hai cách để cài đặt pdf-lib:
Mô-đun NPM
Bạn có thể sử dụng mô-đun npm nếu bạn đang sử dụng npm hoặc yarn làm trình quản lý gói của mình:
Cài đặt bằng NPM
npm install --save pdf-lib
Cài đặt bằng Yarn
yarn add pdf-lib
Mô-đun UMD
Nếu bạn không sử dụng trình quản lý gói, các mô-đun UMD có sẵn trên CDN unpkg và jsDelivr:
- https://unpkg.com/pdf-lib/dist/pdf-lib.js
- https://unpkg.com/pdf-lib/dist/pdf-lib.min.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.min.js
Đọc siêu dữ liệu của PDF
Chúng ta có thể sử dụng thư viện pdf-lib để đọc siêu dữ liệu của tài liệu PDF. Có nhiều hàm như getAuthor, getCreator, getCreationDate v.v. cho phép truy cập hoặc trích xuất siêu dữ liệu của tài liệu PDF như được minh họa trong đoạn mã bên dưới:
Đầu ra
Đoạn mã trên sẽ hiển thị siêu dữ liệu của tài liệu PDF như bên dưới:
Chỉnh sửa siêu dữ liệu của PDF
Chúng ta cũng có thể sử dụng thư viện pdf-lib để chỉnh sửa hoặc cập nhật siêu dữ liệu của tài liệu PDF. Giống như các hàm get (getAuthor, getCreator, v.v.), pdf-lib cũng cung cấp các hàm set (như setAuthor, setCreator, v.v.) để cập nhật siêu dữ liệu của tệp PDF. Chúng ta sẽ sử dụng các hàm setAuthor và setTitle để cập nhật siêu dữ liệu của tài liệu PDF trong đoạn mã dưới đây cho mục đích trình diễn:
Phần kết luận
Các nhà phát triển JavaScript có thể dễ dàng đọc/trích xuất và cập nhật siêu dữ liệu của các tài liệu PDF bằng thư viện pdf-lib. API khá gọn gàng và cung cấp các hàm set/get chuẩn để đọc và cập nhật các thuộc tính của tài liệu PDF. Không có vấn đề nào được quan sát thấy liên quan đến việc quản lý siêu dữ liệu của PDF trong quá trình sử dụng của chúng tôi.