Open Source Python Metadata Library
Gratis & öppen källkod Python-bibliotek för att läsa, redigera och uppdatera metadata för dokument.
Vad är Hachoir-metadata API för Python?
hachoir-metadata är ett Python-bibliotek som är en del av det bredare Hachoir-projektet, designat för att analysera och extrahera metadata från en mängd olika filer typer. Den tillhandahåller verktyg för att läsa metadata utan att behöva dekomprimera eller helt avkoda filerna, vilket gör den lätt och effektiv för grundläggande metadatainspektionsuppgifter.
Funktioner i hachoir-metadata API
hachoir-metadata is a powerful API that has rich features as follow:- Stöd för filtyper: Fungerar med många filformat, inklusive bilder, videor, ljudfiler, arkiv och dokument.
- Metadataextraktion: Extraherar grundläggande metadata som filstorlek, skapelsedatum, ändringsdatum och mer formatspecifika egenskaper (t.ex. EXIF för bilder, codecs för videor, etc.).
- Skrivskyddade operationer: Fokuserar på att läsa och inspektera metadata utan att ändra originalfilen.
- Agnostisk filtyp: Upptäcker automatiskt filtyper och extraherar metadata därefter.
- Integration: Kan integreras i Python-applikationer för användning i arbetsflöden som innehållsorganisation, digital kriminalteknik och arkivsystem.
Lägen för hachoir-metadata API
- klassiskt läge: extrahera metadata, du kan använda –level=LEVEL för att begränsa mängden information som ska visas (och inte för att extrahera)
- typ: visa filformatet och den viktigaste informationen på en rad
- mime: visa bara filens MIME-typ
Komma igång med Hachoir API för Python
För att kunna använda Hachoir API för Python måste du installera Python 3.6+ version och Hachoir på ditt system. Så installera först Python och använd sedan nedanstående kommandon för att installera Hachoir API på din maskin med pip och virtuell miljö.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Arbeta med hachoir-metadata API för Python - Exempel
hachoir-metadata API för Python låter dig läsa metadatainformationen från mediafiltyper. Med bara några rader kod kan du utveckla kraftfulla applikationer som kan läsa metadatainformation från olika filformat. Följande kodexempel visar hur hachoir-metadata API kan användas i Python-applikationer.
Arbeta med hachoir-metadata API för Python - Exempel
pyExifTool ger dig stöd för att läsa metadata av en mängd olika filformat som PDF, BMP, JPEG, DOCX, XLSX och många andra. API:et låter dig läsa metadatainformationen för en fil med metoden get_metadata. Kontrollera kodavsnittet nedan där vi läser metadatainformationen från en PDF-fil.
Produktion
När du kör den här koden kommer utdata att vara något liknande följande (beroende på informationen som finns tillgänglig i din exempelfil:
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Slutsats
Hachoir-metadata API erbjuder en kraftfull men ändå lätt lösning för att extrahera metadata från en mängd olika filformat, vilket gör det till ett utmärkt verktyg för pythonutvecklare som arbetar inom områden som digital forensik, innehållshantering och dataanalys. Dess förmåga att analysera filer utan modifiering säkerställer dataintegritet, medan dess Pythonic-gränssnitt förenklar integrationen i applikationer och arbetsflöden. Med stöd för olika filtyper och metadataegenskaper är hachoir-metadata ett mångsidigt val för snabb och effektiv metadatainspektion för både personliga såväl som professionella projekt/system.