Nyílt forráskódú Python metaadattár
Ingyenes és nyílt forráskódú Python-könyvtár dokumentumok metaadatainak olvasásához, szerkesztéséhez és frissítéséhez.
Mi az a Hachoir-metadata API a Python számára?
A hachoir-metadata egy Python-könyvtár, amely a szélesebb körű Hachoir-projekt része, és a metaadatok elemzésére és a fájlok széles skálájából való kinyerésére szolgál. típusok. Eszközöket biztosít a metaadatok olvasásához anélkül, hogy ki kellene tömöríteni vagy teljesen dekódolni kellene a fájlokat, így könnyű és hatékony az alapvető metaadat-ellenőrzési feladatokhoz.
A hachoir-metadata API jellemzői
hachoir-metadata is a powerful API that has rich features as follow:- Fájltípus-támogatás: Számos fájlformátummal működik, beleértve a képeket, videókat, hangfájlokat, archívumokat és dokumentumokat.
- Metaadatok kinyerése: Kivonja az alapvető metaadatokat, például a fájlméretet, a létrehozás dátumát, a módosítás dátumát és a formátumspecifikus tulajdonságokat (pl. EXIF képekhez, kodekek videókhoz stb.).
- Csak olvasható műveletek: A metaadatok olvasására és ellenőrzésére összpontosít, az eredeti fájl módosítása nélkül.
- Agnostic fájltípus: automatikusan felismeri a fájltípusokat, és ennek megfelelően kibontja a metaadatokat.
- Integráció: Python-alkalmazásokba integrálható olyan munkafolyamatokhoz, mint a tartalomszervezés, a digitális kriminalisztika és az archiválási rendszerek.
A hachoir-metadata API módozatai
- klasszikus mód: metaadatok kibontása, a –level=LEVEL használatával korlátozhatja a megjelenítendő (és nem a kivonat) információ mennyiségét.
- type: egy sorban mutatja a fájlformátumot és a legfontosabb információkat
- mime: csak a MIME típusú fájl megjelenítése
Ismerkedés a Hachoir API-val Pythonhoz
A Hachoir API for Python használatához telepítenie kell a Python 3.6+ verzióját és a Hachoir-t a rendszerére. Tehát először telepítse a Pythont, majd az alábbi parancsok segítségével telepítse a Hachoir API-t a gépére a pip és virtuális környezet.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Hachoir-metadata API használata Pythonhoz – Példák
A hachoir-metadata API for Python lehetővé teszi a metaadat-információk beolvasását médiafájltípusokból. Mindössze néhány sornyi kóddal hatékony alkalmazásokat fejleszthet, amelyek képesek különböző fájlformátumokból metaadat-információkat olvasni. A következő kódpéldák bemutatják, hogyan használható a hachoir-metadata API Python alkalmazásokban.
Hachoir-metadata API használata Pythonhoz – Példák
A pyExifTool támogatja a különféle fájlformátumok metaadatainak olvasását, mint például a PDF, BMP, JPEG, DOCX, XLSX és sok más fájl. Az API lehetővé teszi, hogy a get_metadata metódus használatával beolvassa a fájl metaadat-információit. Ellenőrizze az alábbi kódrészletet, ahol egy PDF-fájlból olvassuk ki a metaadat-információkat.
Kimenet
Amikor végrehajtja ezt a kódot, a kimenet némileg hasonló lesz a következőhöz (a mintafájlban elérhető információktól függően:
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Következtetés
A hachoir-metadata API hatékony, de könnyű megoldást kínál metaadatok kinyerésére a legkülönfélébb fájlformátumokból, így kiváló eszköz a python fejlesztők számára, akik olyan területeken dolgoznak, mint a digitális kriminalisztika, tartalomkezelés és adatelemzés. A fájlok módosítás nélküli elemzésének képessége biztosítja az adatok integritását, míg a Pythonic interfész leegyszerűsíti az alkalmazásokba és munkafolyamatokba való integrációt. A különféle fájltípusok és metaadat-tulajdonságok támogatásával a hachoir-metadata sokoldalú választás a gyors és hatékony metaadat-ellenőrzéshez mind személyes, mind szakmai projektek/rendszerek számára.