Bibliothèque de métadonnées Python Open Source
Bibliothèque Python gratuite et open source pour lire, éditer et mettre à jour les métadonnées des documents.
Qu'est-ce que l'API Hachoir-metadata pour Python ?
hachoir-metadata est une bibliothèque Python qui fait partie du projet plus vaste Hachoir, conçu pour analyser et extraire des métadonnées à partir d'une grande variété de types de fichiers. Il fournit des outils pour lire les métadonnées sans avoir besoin de décompresser ou de décoder complètement les fichiers, ce qui le rend léger et efficace pour les tâches d'inspection de métadonnées de base.
Fonctionnalités de l'API hachoir-metadata
hachoir-metadata is a powerful API that has rich features as follow:- Prise en charge des types de fichiers : fonctionne avec de nombreux formats de fichiers, notamment les images, les vidéos, les fichiers audio, les archives et les documents.
- Extraction de métadonnées : extrait les métadonnées de base telles que la taille du fichier, la date de création, la date de modification et d'autres propriétés spécifiques au format (par exemple, EXIF pour les images, codecs pour les vidéos, etc.).
- Opérations en lecture seule : se concentrent sur la lecture et l'inspection des métadonnées sans modifier le fichier d'origine.
- Agnostique au type de fichier : détecte automatiquement les types de fichiers et extrait les métadonnées en conséquence.
- Intégration : peut être intégré dans des applications Python pour une utilisation dans des flux de travail tels que l'organisation de contenu, la criminalistique numérique et les systèmes d'archivage.
Modes de l'API hachoir-metadata
- mode classique : extraire les métadonnées, vous pouvez utiliser –level=LEVEL pour limiter la quantité d'informations à afficher (et non à extraire)
- type : affiche sur une seule ligne le format du fichier et les informations les plus importantes
- mime : affiche simplement le type MIME du fichier
Premiers pas avec l'API Hachoir pour Python
Pour utiliser l'API Hachoir pour Python, vous devez installer la version Python 3.6+ et Hachoir sur votre système. Commencez donc par installer Python, puis utilisez les commandes ci-dessous pour installer l'API Hachoir sur votre machine à l'aide de pip et de environnement virtuel.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Travailler avec l'API hachoir-metadata pour Python - Exemples
L'API hachoir-metadata pour Python vous permet de lire les informations de métadonnées à partir de types de fichiers multimédias. Avec seulement quelques lignes de code, vous pouvez développer des applications puissantes capables de lire les informations de métadonnées à partir de différents formats de fichiers. Les exemples de code suivants montrent comment l'API hachoir-metadata peut être utilisée dans les applications Python.
Travailler avec l'API hachoir-metadata pour Python - Exemples
pyExifTool vous permet de lire les métadonnées d'une variété de formats de fichiers tels que PDF, BMP, JPEG, DOCX, XLSX et bien d'autres. L'API vous permet de lire les informations de métadonnées d'un fichier à l'aide de la méthode get_metadata. Consultez l'extrait de code ci-dessous où nous lisons les informations de métadonnées d'un fichier PDF.
Sortir
Lorsque vous exécutez ce code, le résultat sera quelque peu similaire à ce qui suit (en fonction des informations disponibles dans votre fichier d'exemple :
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Conclusion
L'API hachoir-metadata offre une solution puissante mais légère pour extraire des métadonnées à partir d'une grande variété de formats de fichiers, ce qui en fait un excellent outil pour les développeurs Python travaillant dans des domaines tels que la criminalistique numérique, la gestion de contenu et l'analyse de données. Sa capacité à analyser les fichiers sans modification garantit l'intégrité des données, tandis que son interface Python simplifie l'intégration dans les applications et les flux de travail. Avec la prise en charge de divers types de fichiers et propriétés de métadonnées, hachoir-metadata est un choix polyvalent pour une inspection rapide et efficace des métadonnées pour les projets/systèmes personnels et professionnels.