Open Source Python Metadata Bibliotheek
Gratis en open source Python-bibliotheek om metagegevens van documenten te lezen, bewerken en bijwerken.
Wat is de Hachoir-metadata API voor Python?
hachoir-metadata is een Python-bibliotheek die deel uitmaakt van het bredere Hachoir-project, ontworpen voor het parsen en extraheren van metadata uit een breed scala aan bestandstypen. Het biedt tools om metadata te lezen zonder de bestanden te hoeven decomprimeren of volledig te decoderen, waardoor het lichtgewicht en efficiënt is voor basistaken voor metadata-inspectie.
Kenmerken van hachoir-metadata API
hachoir-metadata is a powerful API that has rich features as follow:- Ondersteuning voor bestandstypen: werkt met veel bestandsindelingen, waaronder afbeeldingen, video's, audiobestanden, archieven en documenten.
- Metadata-extractie: Extraheert basismetadata, zoals bestandsgrootte, aanmaakdatum, wijzigingsdatum en meer formaatspecifieke eigenschappen (bijvoorbeeld EXIF voor afbeeldingen, codecs voor video's, enz.).
- Alleen-lezen-bewerkingen: richt zich op het lezen en inspecteren van metagegevens zonder het oorspronkelijke bestand te wijzigen.
- Bestandstype-onafhankelijk: detecteert automatisch bestandstypen en extraheert op basis daarvan metagegevens.
- Integratie: Kan worden geïntegreerd in Python-toepassingen voor gebruik in workflows zoals inhoudsorganisatie, digitale forensische analyse en archiefsystemen.
Modi van hachoir-metadata API
- klassieke modus: metadata extraheren, u kunt –level=LEVEL gebruiken om de hoeveelheid weer te geven informatie te beperken (en niet te extraheren)
- type: toon op één regel het bestandsformaat en de belangrijkste informatie
- mime: geef alleen het MIME-type van het bestand weer
Aan de slag met Hachoir API voor Python
Om Hachoir API voor Python te gebruiken, moet u Python 3.6+ versie en Hachoir op uw systeem installeren. Installeer dus eerst Python en gebruik vervolgens onderstaande opdrachten om Hachoir API op uw machine te installeren met behulp van pip en virtual environment.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Werken met hachoir-metadata API voor Python - Voorbeelden
hachoir-metadata API voor Python laat u de metadata-informatie van mediabestandstypen lezen. Met slechts een paar regels code kunt u krachtige applicaties ontwikkelen die metadata-informatie van verschillende bestandsformaten kunnen lezen. De volgende codevoorbeelden laten zien hoe de hachoir-metadata API kan worden gebruikt in Python-applicaties.
Werken met hachoir-metadata API voor Python - Voorbeelden
pyExifTool biedt u ondersteuning voor het lezen van metadata van verschillende bestandsformaten zoals PDF, BMP, JPEG, DOCX, XLSX en vele anderen. Met de API kunt u de metadata-informatie van een bestand lezen met behulp van de get_metadata-methode. Bekijk het onderstaande codefragment waarin we de metadata-informatie van een PDF-bestand lezen.
Uitvoer
Wanneer u deze code uitvoert, zal de uitvoer er ongeveer zo uitzien (afhankelijk van de informatie in uw voorbeeldbestand):
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Conclusie
De hachoir-metadata API biedt een krachtige maar lichtgewicht oplossing voor het extraheren van metadata uit een breed scala aan bestandsformaten, wat het een uitstekende tool maakt voor python-ontwikkelaars die werken in velden zoals digitale forensica, contentbeheer en data-analyse. Het vermogen om bestanden te parseren zonder wijziging zorgt voor data-integriteit, terwijl de Pythonic-interface de integratie in applicaties en workflows vereenvoudigt. Met ondersteuning voor diverse bestandstypen en metadata-eigenschappen is hachoir-metadata een veelzijdige keuze voor snelle en efficiënte metadata-inspectie voor zowel persoonlijke als professionele projecten/systemen.