Biblioteca de metadatos de Python de código abierto
Biblioteca Python gratuita y de código abierto para leer, editar y actualizar metadatos de documentos.
¿Qué es pyExifTool?
La biblioteca Python pyExifTool es un contenedor liviano alrededor de la popular utilidad ExifTool, que permite a los usuarios interactuar con metadatos de archivos de manera programática. Con soporte para varios formatos de archivo, incluidos archivos PDF, imágenes, videos y archivos de audio, pyexiftool brinda la capacidad de leer, escribir y eliminar metadatos utilizando las potentes funciones de ExifTool. La biblioteca está diseñada para aprovechar las capacidades de línea de comandos de ExifTool y, al mismo tiempo, ofrece una interfaz Pythonic para facilitar su uso. En esta página, analizaremos cómo los desarrolladores pueden usar la API de pyExifTool en sus aplicaciones Python para trabajar con metadatos de archivos.
Introducción a pyExifTool
Para poder utilizar pyExifTool, debe instalar la versión 3.6+ de Python y ExifTool en su sistema. Por lo tanto, primero instale Python y luego use los siguientes comandos para instalar pyExifTool en su máquina usando pip y virtual environment.
python -m pip install -U pyexiftool
1. Checkout the source code from Github repository git clone git://github.com/sylikc/pyexiftool.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Lectura de metadatos de archivos PDF y otros
pyExifTool le brinda soporte para leer metadatos de una variedad de formatos de archivos, como PDF, BMP, JPEG, DOCX, XLSX y muchos otros. La API le permite leer la información de metadatos de un archivo mediante el método get_metadata. Consulte el siguiente fragmento de código donde leemos la información de metadatos de un archivo PDF.
Producción
La siguiente captura de pantalla muestra los metadatos del archivo PDF:
Actualización de metadatos de archivos PDF y otros formatos
También puedes actualizar los metadatos de un PDF o cualquier otro documento mediante la herramienta pyExifTool. La herramienta te permite actualizar los campos de metadatos, como autor, productor, tema, título, etc., configurando las etiquetas. Esto se muestra en el siguiente código de ejemplo.
Conclusión
En conclusión, pyExifTool Python es una potente biblioteca de Python para leer y actualizar los metadatos de diferentes tipos de documentos. Se basa en ExifTool, que admite múltiples formatos de archivo para leer y escribir metadatos. Los desarrolladores de aplicaciones Python pueden utilizarla para desarrollar programas que puedan leer y escribir los metadatos de un documento en sencillos pasos.