Biblioteca de metadatos PDF de Python de código abierto
Biblioteca Python gratuita y de código abierto para leer y actualizar metadatos de documentos PDF.
¿Qué es pypdf?
Pypdf es una biblioteca de código abierto versátil de Python conocida por su conjunto diverso de funciones para la manipulación de PDF. Esta biblioteca resulta útil para diversas manipulaciones de PDF, como análisis de PDF y división y fusión de PDF, etc., pero en esta revisión del producto, solo nos centraremos en sus funciones de gestión de metadatos de PDF.
A continuación se muestran las principales características de pypdf relacionadas con los metadatos:
- Leer metadatos PDF: puede leer propiedades (como autor, creador, productor, título, tema y palabras clave) de documentos PDF usando pypdf.
- Actualizar metadatos PDF: también puedes actualizar los metadatos de los documentos PDF usando pypdf.
Introducción a PyPDF
Necesita la versión 3.6.0 o superior de Python para instalar y usar pypdf. Por lo tanto, primero instale Python y luego use los siguientes comandos para instalar pypdf en su máquina usando pip y virtual environment.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
Sistema operativo Mac
python -m venv venv
source venv/bin/activate
pip install pypdf
Ventanas
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Lectura de metadatos de PDF
Podemos leer los metadatos de un documento PDF utilizando la biblioteca pypdf. Obtendremos los metadatos de un PDF de la propiedad metadata de la clase PdfReader en la biblioteca pypdf. Consulte el siguiente fragmento de código para obtener más detalles:
Producción
La siguiente captura de pantalla muestra los metadatos del archivo PDF proporcionado:
Actualización de metadatos de PDF
También podemos actualizar los metadatos de un documento PDF, como el autor, el productor, el tema y el título, etc., utilizando la biblioteca pypdf. Pasaremos un objeto que contenga la información de los metadatos al método add_metadata de la clase PdfWriter en la biblioteca pypdf para actualizar/escribir los metadatos del documento PDF. Para obtener más detalles, consulte el siguiente fragmento de código:
Conclusión
En conclusión, pypdf demuestra ser una biblioteca Python excepcional para leer y actualizar metadatos de documentos PDF. Los desarrolladores pueden leer y actualizar fácilmente los metadatos de los documentos PDF sin ningún problema.
Productos Similares
- Biblioteca Mutagen Python administre metadatos de audio sin esfuerzo
- Biblioteca Python de PikePDF manipulación y seguridad de archivos PDF sin esfuerzo
- Biblioteca Python PyMuPDF para metadatos PDF | Código abierto
- hachoir | Biblioteca Python de código abierto para metadatos de documentos
- pdf-lib para JavaScript | Administra fácilmente los metadatos de PDF