Open Source Python Metadata Library
Bezplatná a open source knihovna Python pro čtení, úpravu a aktualizaci metadat dokumentů.
Co je Hachoir-metadata API pro Python?
hachoir-metadata je knihovna Pythonu, která je součástí širšího projektu Hachoir, který je navržen pro analýzu a extrahování metadat ze široké škály souborů. typy. Poskytuje nástroje pro čtení metadat bez nutnosti dekomprimovat nebo plně dekódovat soubory, takže je lehký a efektivní pro základní úlohy kontroly metadat.
Vlastnosti hachoir-metadata API
hachoir-metadata is a powerful API that has rich features as follow:- Podpora typů souborů: Funguje s mnoha formáty souborů, včetně obrázků, videí, zvukových souborů, archivů a dokumentů.
- Extrakce metadat: Extrahuje základní metadata, jako je velikost souboru, datum vytvoření, datum úpravy a další vlastnosti specifické pro daný formát (např. EXIF pro obrázky, kodeky pro videa atd.).
- Operace pouze pro čtení: Zaměřuje se na čtení a kontrolu metadat bez úpravy původního souboru.
- File Type Agnostic: Automaticky detekuje typy souborů a podle toho extrahuje metadata.
- Integrace: Lze integrovat do aplikací Python pro použití v pracovních postupech, jako je organizace obsahu, digitální forenzní a archivní systémy.
Režimy hachoir-metadata API
- klasický režim: extrahujte metadata, můžete použít –level=LEVEL k omezení množství informací k zobrazení (a nikoli k extrahování)
- type: zobrazí na jednom řádku formát souboru a nejdůležitější informace
- mime: pouze zobrazí soubor typu MIME
Začínáme s Hachoir API pro Python
Abyste mohli používat Hachoir API pro Python, musíte si do systému nainstalovat Python 3.6+ verzi a Hachoir. Nejprve tedy nainstalujte Python a poté pomocí níže uvedených příkazů nainstalujte do počítače Hachoir API pomocí pip a virtuální prostředí.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Práce s hachoir-metadata API pro Python - příklady
hachoir-metadata API pro Python vám umožňuje číst informace o metadatech z typů mediálních souborů. Pomocí několika řádků kódu můžete vyvíjet výkonné aplikace, které dokážou číst informace o metadatech z různých formátů souborů. Následující ukázky kódu ukazují, jak lze hachoir-metadata API použít v aplikacích Pythonu.
Práce s hachoir-metadata API pro Python - příklady
pyExifTool vám poskytuje podporu pro čtení metadat různých formátů souborů, jako jsou PDF, BMP, JPEG, DOCX, XLSX a mnoho dalších. Rozhraní API vám umožňuje číst informace o metadatech souboru pomocí metody get_metadata. Zkontrolujte níže uvedený fragment kódu, kde čteme informace o metadatech ze souboru PDF.
Výstup
Když spustíte tento kód, výstup bude poněkud podobný následujícímu (v závislosti na informacích dostupných ve vašem ukázkovém souboru:
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Závěr
Hachoir-metadata API nabízí výkonné, ale lehké řešení pro extrakci metadat z široké škály formátů souborů, což z něj dělá vynikající nástroj pro vývojáře pythonu pracující v oborech, jako je digitální forenzní, správa obsahu a analýza dat. Jeho schopnost analyzovat soubory bez úprav zajišťuje integritu dat, zatímco jeho rozhraní Pythonic zjednodušuje integraci do aplikací a pracovních postupů. Díky podpoře různých typů souborů a vlastností metadat jsou hachoir-metadata všestrannou volbou pro rychlou a efektivní kontrolu metadat pro osobní i profesionální projekty/systémy.