Biblioteca de metadades Python de codi obert
Biblioteca Python gratuïta i de codi obert per llegir, editar i actualitzar metadades de documents.
Què és l'API de metadades Hachoir per a Python?
hachoir-metadata és una biblioteca de Python que forma part del projecte Hachoir més ampli, dissenyat per analitzar i extreure metadades d'una gran varietat de fitxers. tipus. Proporciona eines per llegir metadades sense necessitat de descomprimir o descodificar completament els fitxers, cosa que el fa lleuger i eficient per a les tasques bàsiques d'inspecció de metadades.
Característiques de l'API hachoir-metadata
hachoir-metadata is a powerful API that has rich features as follow:- Compatibilitat amb tipus de fitxer: funciona amb molts formats de fitxer, com ara imatges, vídeos, fitxers d'àudio, arxius i documents.
- Extracció de metadades: extreu metadades bàsiques, com ara la mida del fitxer, la data de creació, la data de modificació i més propietats específiques de format (p. ex., EXIF per a imatges, còdecs per a vídeos, etc.).
- Operacions de només lectura: se centra a llegir i inspeccionar les metadades sense modificar el fitxer original.
- Agnòstic de tipus de fitxer: detecta automàticament els tipus de fitxer i extreu les metadades en conseqüència.
- Integració: es pot integrar a les aplicacions de Python per utilitzar-les en fluxos de treball com l'organització de continguts, la investigació forense digital i els sistemes d'arxiu.
Modes de l'API hachoir-metadata
- mode clàssic: extreu metadades, podeu utilitzar –level=LEVEL per limitar la quantitat d'informació a mostrar (i no extreure)
- type: mostra en una línia el format del fitxer i la informació més important
- mime: només mostra el tipus MIME del fitxer
Introducció a l'API Hachoir per a Python
Per utilitzar l'API Hachoir per a Python, cal que instal·leu la versió 3.6 o posterior de Python i Hachoir al vostre sistema. Per tant, primer instal·leu Python i després utilitzeu les ordres següents per instal·lar l'API Hachoir a la vostra màquina mitjançant pip i virtual medi ambient.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Treballant amb l'API hachoir-metadata per a Python: exemples
L'API hachoir-metadata per a Python us permet llegir la informació de metadades dels tipus de fitxers multimèdia. Amb només unes poques línies de codi, podeu desenvolupar aplicacions potents que poden llegir informació de metadades de diferents formats de fitxer. Els exemples de codi següents mostren com es pot utilitzar l'API hachoir-metadata a les aplicacions de Python.
Treballant amb l'API hachoir-metadata per a Python: exemples
pyExifTool us ofereix suport per llegir metadades d'una varietat de formats de fitxer com PDF, BMP, JPEG, DOCX, XLSX i molts altres. L'API us permet llegir la informació de metadades d'un fitxer mitjançant el mètode get_metadata. Comproveu el fragment de codi següent on llegim la informació de metadades d'un fitxer PDF.
Sortida
Quan executeu aquest codi, la sortida serà una mica similar a la següent (depenent de la informació disponible al vostre fitxer de mostra:
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Conclusió
L'API hachoir-metadata ofereix una solució potent però lleugera per extreure metadades d'una gran varietat de formats de fitxer, la qual cosa la converteix en una eina excel·lent per als desenvolupadors de Python que treballen en camps com la forense digital, la gestió de continguts i l'anàlisi de dades. La seva capacitat per analitzar fitxers sense modificacions garanteix la integritat de les dades, mentre que la seva interfície Pythonic simplifica la integració en aplicacions i fluxos de treball. Amb suport per a diversos tipus de fitxers i propietats de metadades, hachoir-metadata és una opció versàtil per a una inspecció ràpida i eficient de metadades tant per a projectes/sistemes personals com professionals.
Productes Similars
- API OpenPyXL - Gestioneu les metadades d'Excel sense esforç
- API PyLightXL gestioneu les metadades de fitxers d'Excel de manera eficient
- Biblioteca Mutagen Python - Gestioneu les metadades d'àudio sense esforç
- Biblioteca PikePDF Python manipulació i seguretat de PDF sense esforç
- Biblioteca PyMuPDF Python per a metadades PDF | codi obert