Biblioteca de metadatos PDF de Python de código abierto
Biblioteca Python gratuita y de código abierto para leer y actualizar metadatos de documentos PDF.
¿Qué es pypdf?
Pypdf es una biblioteca Python de código abierto versátil conocida por su conjunto diverso de funciones para la manipulación de PDF. Esta biblioteca resulta útil para diversas manipulaciones de PDF como análisis de PDF y división y fusión de PDF. etc., pero en esta revisión del producto, solo nos centraremos en sus funciones de administración de metadatos PDF.
Las siguientes son las características principales de pypdf relacionadas con los metadatos:
- Leer metadatos de PDF: Puede leer propiedades (como autor, creador, productor, título, tema y palabras clave) de documentos PDF utilizando pypdf.
- Actualizar metadatos de PDF: También puede actualizar los metadatos de documentos PDF utilizando pypdf.
Empezando con pypdf
Necesita la versión 3.6.0 o superior de Python para instalar y utilizar pypdf. Entonces, primero instale Python y luego use los siguientes comandos para instalar pypdf en su máquina usando pip y entorno virtual.
linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
Mac OS
python -m venv venv
source venv/bin/activate
pip install pypdf
ventanas
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Lectura de metadatos de PDF
Podemos leer los metadatos de un documento PDF usando la biblioteca pypdf. Obtendremos los metadatos de un PDF de la propiedad metadata de la clase PdfReader en la biblioteca pypdf. Consulte el siguiente fragmento de código para obtener más detalles:
Producción
La siguiente captura de pantalla muestra los metadatos del archivo PDF proporcionado:
Actualización de metadatos de PDF
También podemos actualizar los metadatos de un documento PDF, como autor, productor, tema y título, etc., utilizando la biblioteca pypdf. Pasaremos un objeto que contiene la información de metadatos al método add_metadata de la clase PdfWriter en la biblioteca pypdf para actualizar/escribir metadatos del documento PDF. Para obtener más información, consulte el siguiente fragmento de código:
Conclusión
En conclusión, pypdf demuestra ser una biblioteca Python excepcional para leer y actualizar metadatos de documentos PDF. Los desarrolladores pueden leer y actualizar fácilmente los metadatos de documentos PDF sin ningún problema.