Darmowa biblioteka JavaScript do zarządzania metadanymi PDF
Darmowa i otwartoźródłowa biblioteka JavaScript do zarządzania metadanymi dokumentów PDF.
Czym jest pdf-lib?
Pdf-lib to darmowa i otwarta biblioteka JavaScript do pracy z dokumentami PDF, która umożliwia wykonywanie operacji, takich jak tworzenie nowych plików PDF od podstaw, modyfikowanie istniejących lub odczytywanie i aktualizowanie metadanych dokumentów PDF. Omówiliśmy już funkcje edycji PDF w pdf-lib, ale w tej recenzji skupimy się tylko na funkcjach zarządzania metadanymi w pdf-lib, które obejmują:
- Autor
- Twórca
- Producent
- Tytuł
- Temat
- Słowa kluczowe
- Język
- Data utworzenia
- Data modyfikacji
- Aktualizacja metadanych: Możesz również zaktualizować powyższe metadane dokumentów PDF za pomocą pdf-lib.
Pierwsze kroki z pdf-lib
Istnieją dwa sposoby instalacji pdf-lib:
Moduły NPM
Możesz używać modułów npm, jeśli używasz npm lub yarn jako menedżera pakietów:
Zainstaluj za pomocą NPM
npm install --save pdf-lib
Zainstaluj za pomocą Yarn
yarn add pdf-lib
Moduły UMD
Jeśli nie używasz menedżera pakietów, moduły UMD są dostępne w sieciach CDN unpkg i jsDelivr:
- https://unpkg.com/pdf-lib/dist/pdf-lib.js
- https://unpkg.com/pdf-lib/dist/pdf-lib.min.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.min.js
Przeczytaj metadane pliku PDF
Możemy wykorzystać bibliotekę pdf-lib do odczytu metadanych dokumentów PDF. Istnieje wiele funkcji, takich jak getAuthor, getCreator, getCreationDate itp., które umożliwiają dostęp do metadanych dokumentów PDF lub ich wyodrębnianie, jak pokazano w poniższym fragmencie kodu:
Wyjście
Powyższy fragment kodu wyświetli metadane dokumentu PDF, jak pokazano poniżej:
Edytuj metadane pliku PDF
Możemy również wykorzystać bibliotekę pdf-lib do edycji lub aktualizacji metadanych dokumentów PDF. Podobnie jak funkcje get (getAuthor, getCreator itd.), pdf-lib udostępnia również funkcje set (takie jak setAuthor, setCreator itd.) do aktualizacji metadanych plików PDF. Użyjemy funkcji setAuthor i setTitle do aktualizacji metadanych dokumentu PDF w poniższym fragmencie kodu w celach demonstracyjnych:
Wniosek
Programistom JavaScript łatwiej jest czytać/wyodrębniać i aktualizować metadane dokumentów PDF za pomocą biblioteki pdf-lib. API jest całkiem schludne i zapewnia standardowe funkcje set/get do odczytywania i aktualizowania właściwości dokumentów PDF. Nie zaobserwowano żadnych problemów dotyczących zarządzania metadanymi plików PDF podczas naszego użytkowania.
Podobne Produkty
- API OpenPyXL — bezproblemowe zarządzanie metadanymi programu Excel
- Biblioteka Mutagen Python — bezproblemowe zarządzanie metadanymi audio
- Biblioteka PikePDF Python — bezproblemowa manipulacja plikami PDF i bezpieczeństwo
- Biblioteka Pythona PyMuPDF dla metadanych PDF | Open Source
- hachoir | Biblioteka języka Python typu open source dla metadanych dokumentów