Biblioteca de metadatos PDF de Python de código abierto

Biblioteca Python gratuita y de código abierto para leer y actualizar metadatos de documentos PDF.

¿Qué es pypdf?

Pypdf es una biblioteca Python de código abierto versátil conocida por su conjunto diverso de funciones para la manipulación de PDF. Esta biblioteca resulta útil para diversas manipulaciones de PDF como análisis de PDF y división y fusión de PDF. etc., pero en esta revisión del producto, solo nos centraremos en sus funciones de administración de metadatos PDF.

Las siguientes son las características principales de pypdf relacionadas con los metadatos:

  • Leer metadatos de PDF: Puede leer propiedades (como autor, creador, productor, título, tema y palabras clave) de documentos PDF utilizando pypdf.
  • Actualizar metadatos de PDF: También puede actualizar los metadatos de documentos PDF utilizando pypdf.
GitHub

Estadísticas de GitHub

Nombre:
Idioma:
Estrellas:
Tenedores:
Licencia:
El repositorio se actualizó por última vez en

Empezando con pypdf

Necesita la versión 3.6.0 o superior de Python para instalar y utilizar pypdf. Entonces, primero instale Python y luego use los siguientes comandos para instalar pypdf en su máquina usando pip y entorno virtual.

Lectura de metadatos de PDF

Podemos leer los metadatos de un documento PDF usando la biblioteca pypdf. Obtendremos los metadatos de un PDF de la propiedad metadata de la clase PdfReader en la biblioteca pypdf. Consulte el siguiente fragmento de código para obtener más detalles:

Producción

La siguiente captura de pantalla muestra los metadatos del archivo PDF proporcionado:

Actualización de metadatos de PDF

También podemos actualizar los metadatos de un documento PDF, como autor, productor, tema y título, etc., utilizando la biblioteca pypdf. Pasaremos un objeto que contiene la información de metadatos al método add_metadata de la clase PdfWriter en la biblioteca pypdf para actualizar/escribir metadatos del documento PDF. Para obtener más información, consulte el siguiente fragmento de código:

Conclusión

En conclusión, pypdf demuestra ser una biblioteca Python excepcional para leer y actualizar metadatos de documentos PDF. Los desarrolladores pueden leer y actualizar fácilmente los metadatos de documentos PDF sin ningún problema.

Productos Similares

 Español