Biblioteca de metadatos PDF de Python de código abierto

Biblioteca Python gratuita y de código abierto para leer y actualizar metadatos de documentos PDF.

¿Qué es pypdf?

Pypdf es una biblioteca de código abierto versátil de Python conocida por su conjunto diverso de funciones para la manipulación de PDF. Esta biblioteca resulta útil para diversas manipulaciones de PDF, como análisis de PDF y división y fusión de PDF, etc., pero en esta revisión del producto, solo nos centraremos en sus funciones de gestión de metadatos de PDF.

A continuación se muestran las principales características de pypdf relacionadas con los metadatos:

  • Leer metadatos PDF: puede leer propiedades (como autor, creador, productor, título, tema y palabras clave) de documentos PDF usando pypdf.
  • Actualizar metadatos PDF: también puedes actualizar los metadatos de los documentos PDF usando pypdf.
GitHub

Estadísticas de GitHub

Nombre:
Idioma:
Estrellas:
Tenedores:
Licencia:
El repositorio se actualizó por última vez en

Introducción a PyPDF

Necesita la versión 3.6.0 o superior de Python para instalar y usar pypdf. Por lo tanto, primero instale Python y luego use los siguientes comandos para instalar pypdf en su máquina usando pip y virtual environment.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

Sistema operativo Mac


python -m venv venv
source venv/bin/activate
pip install pypdf

Ventanas


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Lectura de metadatos de PDF

Podemos leer los metadatos de un documento PDF utilizando la biblioteca pypdf. Obtendremos los metadatos de un PDF de la propiedad metadata de la clase PdfReader en la biblioteca pypdf. Consulte el siguiente fragmento de código para obtener más detalles:

Producción

La siguiente captura de pantalla muestra los metadatos del archivo PDF proporcionado:

Actualización de metadatos de PDF

También podemos actualizar los metadatos de un documento PDF, como el autor, el productor, el tema y el título, etc., utilizando la biblioteca pypdf. Pasaremos un objeto que contenga la información de los metadatos al método add_metadata de la clase PdfWriter en la biblioteca pypdf para actualizar/escribir los metadatos del documento PDF. Para obtener más detalles, consulte el siguiente fragmento de código:

Conclusión

En conclusión, pypdf demuestra ser una biblioteca Python excepcional para leer y actualizar metadatos de documentos PDF. Los desarrolladores pueden leer y actualizar fácilmente los metadatos de los documentos PDF sin ningún problema.

Productos Similares

 Español