Biblioteca gratuita de JavaScript para la gestión de metadatos de PDF
Biblioteca JavaScript gratuita y de código abierto para administrar metadatos de documentos PDF.
¿Qué es pdf-lib?
Pdf-lib es una biblioteca JavaScript gratuita y de código abierto para trabajar con documentos PDF y realizar operaciones como crear nuevos PDF desde cero, modificar los existentes o leer y actualizar metadatos de documentos PDF. Ya hemos hablado de las funciones de edición de PDF de pdf-lib, pero en esta reseña nos centraremos únicamente en las funciones de gestión de metadatos de pdf-lib, que incluyen:
- Autor
- Creador
- Productor
- Título
- Sujeto
- Palabras clave
- Idioma
- Fecha de creación
- Fecha de modificación
- Actualizar metadatos: también puede actualizar los metadatos anteriores de los documentos PDF utilizando pdf-lib.
Introducción a pdf-lib
Hay dos formas de instalar pdf-lib:
Módulos NPM
Puedes usar módulos npm si estás usando npm o yarn como tu administrador de paquetes:
Instalar usando NPM
npm install --save pdf-lib
Instalar usando Yarn
yarn add pdf-lib
Módulos UMD
Si no está utilizando un administrador de paquetes, los módulos UMD están disponibles en los CDN unpkg y jsDelivr:
- https://unpkg.com/pdf-lib/dist/pdf-lib.js
- https://unpkg.com/pdf-lib/dist/pdf-lib.min.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.js
- https://cdn.jsdelivr.net/npm/pdf-lib/dist/pdf-lib.min.js
Leer metadatos de PDF
Podemos utilizar la biblioteca pdf-lib para leer metadatos de documentos PDF. Existen muchas funciones como getAuthor, getCreator, getCreationDate, etc. que permiten acceder o extraer metadatos de los documentos PDF, como se muestra en el siguiente fragmento de código:
Producción
El fragmento de código anterior mostrará los metadatos del documento PDF como se muestra a continuación:
Editar metadatos de PDF
También podemos utilizar la biblioteca pdf-lib para editar o actualizar los metadatos de los documentos PDF. Al igual que las funciones de obtención (getAuthor, getCreator, etc.), pdf-lib también proporciona funciones de configuración (setAuthor, setCreator, etc.) para actualizar los metadatos de los archivos PDF. Usaremos las funciones setAuthor y setTitle para actualizar los metadatos de un documento PDF en el siguiente fragmento de código con fines de demostración:
Conclusión
Es más fácil para los desarrolladores de JavaScript leer, extraer y actualizar metadatos de los documentos PDF utilizando la biblioteca pdf-lib. La API es bastante ordenada y proporciona funciones estándar de configuración y obtención para leer y actualizar propiedades de los documentos PDF. No se observaron problemas con respecto a la administración de metadatos de los archivos PDF durante nuestro uso.