1. produkty
  2.   Metadata
  3.   Python
  4.   hachoir-metadata
 
  

Open Source Python Metadata Library

Bezplatná a open source knihovna Python pro čtení, úpravu a aktualizaci metadat dokumentů.

Co je Hachoir-metadata API pro Python?

hachoir-metadata je knihovna Pythonu, která je součástí širšího projektu Hachoir, který je navržen pro analýzu a extrahování metadat ze široké škály souborů. typy. Poskytuje nástroje pro čtení metadat bez nutnosti dekomprimovat nebo plně dekódovat soubory, takže je lehký a efektivní pro základní úlohy kontroly metadat.

Vlastnosti hachoir-metadata API

hachoir-metadata is a powerful API that has rich features as follow:
  • Podpora typů souborů: Funguje s mnoha formáty souborů, včetně obrázků, videí, zvukových souborů, archivů a dokumentů.
  • Extrakce metadat: Extrahuje základní metadata, jako je velikost souboru, datum vytvoření, datum úpravy a další vlastnosti specifické pro daný formát (např. EXIF pro obrázky, kodeky pro videa atd.).
  • Operace pouze pro čtení: Zaměřuje se na čtení a kontrolu metadat bez úpravy původního souboru.
  • File Type Agnostic: Automaticky detekuje typy souborů a podle toho extrahuje metadata.
  • Integrace: Lze integrovat do aplikací Python pro použití v pracovních postupech, jako je organizace obsahu, digitální forenzní a archivní systémy.

Režimy hachoir-metadata API

  • klasický režim: extrahujte metadata, můžete použít –level=LEVEL k omezení množství informací k zobrazení (a nikoli k extrahování)
  • type: zobrazí na jednom řádku formát souboru a nejdůležitější informace
  • mime: pouze zobrazí soubor typu MIME

Začínáme s Hachoir API pro Python

GitHub

Statistiky GitHubu

Název:
Jazyk:
hvězdy:
Vidlice:
Licence:
Úložiště bylo naposledy aktualizováno v

Abyste mohli používat Hachoir API pro Python, musíte si do systému nainstalovat Python 3.6+ verzi a Hachoir. Nejprve tedy nainstalujte Python a poté pomocí níže uvedených příkazů nainstalujte do počítače Hachoir API pomocí pip a virtuální prostředí.


pip install hachoir

Alternatively, you can also install hachoir from Github repository using the following steps:


1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]

Práce s hachoir-metadata API pro Python - příklady

hachoir-metadata API pro Python vám umožňuje číst informace o metadatech z typů mediálních souborů. Pomocí několika řádků kódu můžete vyvíjet výkonné aplikace, které dokážou číst informace o metadatech z různých formátů souborů. Následující ukázky kódu ukazují, jak lze hachoir-metadata API použít v aplikacích Pythonu.

Práce s hachoir-metadata API pro Python - příklady

pyExifTool vám poskytuje podporu pro čtení metadat různých formátů souborů, jako jsou PDF, BMP, JPEG, DOCX, XLSX a mnoho dalších. Rozhraní API vám umožňuje číst informace o metadatech souboru pomocí metody get_metadata. Zkontrolujte níže uvedený fragment kódu, kde čteme informace o metadatech ze souboru PDF.

Výstup

Když spustíte tento kód, výstup bude poněkud podobný následujícímu (v závislosti na informacích dostupných ve vašem ukázkovém souboru:


Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian

Závěr

Hachoir-metadata API nabízí výkonné, ale lehké řešení pro extrakci metadat z široké škály formátů souborů, což z něj dělá vynikající nástroj pro vývojáře pythonu pracující v oborech, jako je digitální forenzní, správa obsahu a analýza dat. Jeho schopnost analyzovat soubory bez úprav zajišťuje integritu dat, zatímco jeho rozhraní Pythonic zjednodušuje integraci do aplikací a pracovních postupů. Díky podpoře různých typů souborů a vlastností metadat jsou hachoir-metadata všestrannou volbou pro rychlou a efektivní kontrolu metadat pro osobní i profesionální projekty/systémy.

Podobné Produkty

 Czech