Avoimen lähdekoodin Python-metatietokirjasto
Ilmainen ja avoimen lähdekoodin Python-kirjasto asiakirjojen metatietojen lukemiseen, muokkaamiseen ja päivittämiseen.
Mikä on Hachoir-metadata API Pythonille?
hachoir-metadata on Python-kirjasto, joka on osa laajempaa Hachoir-projektia, joka on suunniteltu sisällönkuvaustietojen jäsentämiseen ja poimimiseen useista tiedostoista. tyyppejä. Se tarjoaa työkaluja metatietojen lukemiseen ilman, että tiedostoja tarvitsee purkaa tai kokonaan purkaa, mikä tekee siitä kevyen ja tehokkaan metatietojen perustarkistustehtävissä.
Hachoir-metadata API:n ominaisuudet
hachoir-metadata is a powerful API that has rich features as follow:- Tiedostotyyppituki: Toimii useiden tiedostomuotojen kanssa, mukaan lukien kuvat, videot, äänitiedostot, arkistot ja asiakirjat.
- Metatietojen purkaminen: Poimii perussisällönkuvaustiedot, kuten tiedostokoon, luontipäivämäärän, muokkauspäivämäärän ja muita muotokohtaisia ominaisuuksia (esim. EXIF kuville, koodekit videoille jne.).
- Vain luku -toiminnot: keskittyy sisällönkuvaustietojen lukemiseen ja tarkastamiseen muuttamatta alkuperäistä tiedostoa.
- Tiedostotyyppi Agnostic: Tunnistaa tiedostotyypit automaattisesti ja poimii metatiedot sen mukaisesti.
- Integraatio: Voidaan integroida Python-sovelluksiin käytettäväksi työnkuluissa, kuten sisällön järjestämisessä, digitaalisessa rikosteknisissä ja arkistointijärjestelmissä.
Hachoir-metadata API:n tilat
- klassinen tila: pura metatiedot, voit käyttää -level=LEVEL rajoittaaksesi näytettävän tiedon määrää (eikä purettavaa)
- type: näytä yhdellä rivillä tiedostomuoto ja tärkeimmät tiedot
- mime: näytä vain tiedosto MIME-tyyppi
Pythonin Hachoir API:n käytön aloittaminen
Jotta voit käyttää Hachoirin sovellusliittymää Pythonille, sinun on asennettava Python 3.6+ -versio ja Hachoir järjestelmääsi. Joten asenna ensin Python ja asenna sitten Hachoir API koneellesi alla olevien komentojen avulla käyttämällä pip ja virtuaaliympäristö.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Työskentely hachoir-metadata API:n kanssa Pythonille - Esimerkkejä
Pythonin hachoir-metadata API:n avulla voit lukea metatietotietoja mediatiedostotyypeistä. Vain muutamalla koodirivillä voit kehittää tehokkaita sovelluksia, jotka voivat lukea metatietoja eri tiedostomuodoista. Seuraavat koodiesimerkit osoittavat, kuinka hachoir-metadata API:ta voidaan käyttää Python-sovelluksissa.
Työskentely hachoir-metadata API:n kanssa Pythonille - Esimerkkejä
pyExifTool tarjoaa tukea useiden tiedostomuotojen, kuten PDF, BMP, JPEG, DOCX, XLSX ja monien muiden metatietojen lukemiseen. Sovellusliittymän avulla voit lukea tiedoston metatietotietoja get_metadata-menetelmällä. Tarkista alla oleva koodinpätkä, josta luemme metatietotiedot PDF-tiedostosta.
Lähtö
Kun suoritat tämän koodin, tulos on jonkin verran seuraavanlainen (riippuen näytetiedostossasi olevista tiedoista:
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Johtopäätös
Hachoir-metadata API tarjoaa tehokkaan mutta kevyen ratkaisun metatietojen poimimiseen useista tiedostomuodoista, mikä tekee siitä erinomaisen työkalun python-kehittäjille, jotka työskentelevät esimerkiksi digitaalisen rikostutkimuksen, sisällönhallinnan ja data-analyysin aloilla. Sen kyky jäsentää tiedostoja ilman muutoksia varmistaa tietojen eheyden, kun taas sen Pythonic-käyttöliittymä yksinkertaistaa integrointia sovelluksiin ja työnkulkuihin. Eri tiedostotyyppejä ja metatietoominaisuuksia tukevan hachoir-metadata on monipuolinen valinta nopeaan ja tehokkaaseen metatietojen tarkasteluun sekä henkilökohtaisiin että ammattimaisiin projekteihin/järjestelmiin.