Biblioteca de metadatos de Python de código abierto
Biblioteca Python gratuita y de código abierto para leer, editar y actualizar metadatos de documentos.
¿Qué es la API de metadatos de Hachoir para Python?
hachoir-metadata es una biblioteca de Python que forma parte del proyecto más amplio Hachoir, diseñado para analizar y extraer metadatos de una amplia variedad de tipos de archivos. Proporciona herramientas para leer metadatos sin necesidad de descomprimir o decodificar por completo los archivos, lo que lo hace liviano y eficiente para tareas básicas de inspección de metadatos.
Características de la API de metadatos de hachoir
hachoir-metadata is a powerful API that has rich features as follow:- Compatibilidad con tipos de archivos: Funciona con muchos formatos de archivos, incluidas imágenes, vídeos, archivos de audio, archivos comprimidos y documentos.
- Extracción de metadatos: extrae metadatos básicos como el tamaño del archivo, la fecha de creación, la fecha de modificación y más propiedades específicas del formato (por ejemplo, EXIF para imágenes, códecs para videos, etc.).
- Operaciones de solo lectura: se centra en leer e inspeccionar metadatos sin modificar el archivo original.
- Independiente del tipo de archivo: detecta automáticamente los tipos de archivos y extrae metadatos en consecuencia.
- Integración: se puede integrar en aplicaciones Python para su uso en flujos de trabajo como organización de contenido, análisis forense digital y sistemas de archivo.
Modos de la API de metadatos de hachoir
- Modo clásico: extrae metadatos, puedes usar –level=LEVEL para limitar la cantidad de información a mostrar (y no a extraer)
- type: muestra en una línea el formato del archivo y la información más importante
- mime: solo muestra el tipo MIME del archivo
Introducción a la API de Hachoir para Python
Para utilizar la API de Hachoir para Python, debe instalar la versión 3.6+ de Python y Hachoir en su sistema. Por lo tanto, primero instale Python y luego use los siguientes comandos para instalar la API de Hachoir en su máquina usando pip y virtual environment.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Cómo trabajar con la API de metadatos de hachoir para Python: ejemplos
La API hachoir-metadata para Python le permite leer la información de metadatos de los tipos de archivos multimedia. Con solo unas pocas líneas de código, puede desarrollar aplicaciones potentes que puedan leer información de metadatos de diferentes formatos de archivo. Los siguientes ejemplos de código muestran cómo se puede utilizar la API hachoir-metadata en aplicaciones Python.
Cómo trabajar con la API de metadatos de hachoir para Python: ejemplos
pyExifTool le brinda soporte para leer metadatos de una variedad de formatos de archivos, como PDF, BMP, JPEG, DOCX, XLSX y muchos otros. La API le permite leer la información de metadatos de un archivo mediante el método get_metadata. Consulte el siguiente fragmento de código donde leemos la información de metadatos de un archivo PDF.
Producción
Cuando ejecute este código, el resultado será similar al siguiente (dependiendo de la información disponible en su archivo de muestra):
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Conclusión
La API hachoir-metadata ofrece una solución potente y liviana para extraer metadatos de una amplia variedad de formatos de archivos, lo que la convierte en una excelente herramienta para los desarrolladores de Python que trabajan en campos como la investigación forense digital, la gestión de contenido y el análisis de datos. Su capacidad para analizar archivos sin modificaciones garantiza la integridad de los datos, mientras que su interfaz Pythonic simplifica la integración en aplicaciones y flujos de trabajo. Con soporte para diversos tipos de archivos y propiedades de metadatos, hachoir-metadata es una opción versátil para la inspección rápida y eficiente de metadatos tanto para proyectos/sistemas personales como profesionales.