Biblioteca JavaScript gratuita para gerenciamento de metadados em PDF
Biblioteca JavaScript gratuita e de código aberto para gerenciar metadados de documentos PDF.
O que é pdf-lib?
Pdf-lib é uma biblioteca JavaScript gratuita e de código aberto para trabalhar com documentos PDF para executar operações como criar novos PDFs do zero, modificar os existentes ou ler e atualizar metadados de documentos PDF. Já discutimos os recursos de edição de PDF do pdf-lib, mas nesta revisão, focaremos apenas nos recursos de gerenciamento de metadados do pdf-lib, que incluem:
- Autor
- Criador
- Produtor
- Título
- Assunto
- Palavras-chave
- Linguagem
- Data de criação
- Data de modificação
- Atualizar metadados: você também pode atualizar os metadados acima de documentos PDF usando pdf-lib.
Introdução ao pdf-lib
Há duas maneiras de instalar o pdf-lib:
Módulos NPM
Você pode usar módulos npm se estiver usando npm ou yarn como seu gerenciador de pacotes:
Instalar usando NPM
npm install --save pdf-lib
Instalar usando Yarn
yarn add pdf-lib
Módulos UMD
Se você não estiver usando um gerenciador de pacotes, os módulos UMD estão disponíveis nos CDNs unpkg e jsDelivr:
- https://unpkg.com/pdf-lib/dist/pdf-lib.js
- https://unpkg.com/pdf-lib/dist/pdf-lib.min.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.min.js
Ler metadados de PDF
Podemos utilizar a biblioteca pdf-lib para ler metadados de documentos PDF. Há muitas funções como getAuthor, getCreator, getCreationDate etc. que permitem acessar ou extrair metadados de documentos PDF, conforme demonstrado no trecho de código abaixo:
Saída
O trecho de código acima exibirá os metadados do documento PDF, conforme mostrado abaixo:
Editar metadados do PDF
Também podemos utilizar a biblioteca pdf-lib para editar ou atualizar metadados de documentos PDF. Assim como as funções get (getAuthor, getCreator etc.), a pdf-lib também fornece funções set (como setAuthor, setCreator e assim por diante) para atualizar metadados de arquivos PDF. Usaremos as funções setAuthor e setTitle para atualizar os metadados de um documento PDF no trecho de código abaixo para fins de demonstração:
Conclusão
É mais fácil para desenvolvedores JavaScript ler/extrair e atualizar metadados de documentos PDF usando a biblioteca pdf-lib. A API é bem organizada e fornece funções set/get padrão para ler e atualizar propriedades de documentos PDF. Nenhum problema é observado em relação ao gerenciamento de metadados de PDFs durante nosso uso.
Produtos Similares
- Biblioteca Mutagen Python - Gerencie Metadados de Áudio Sem Esforço
- Biblioteca Python PikePDF - Manipulação e segurança de PDF sem esforço
- Biblioteca Python PyMuPDF para metadados PDF | Código aberto
- hachoir | Biblioteca Python de código aberto para metadados de documentos
- OpenPyXL API - Gerencie metadados do Excel sem esforço