Biblioteka metadanych Open Source Pythona
Darmowa i otwartoźródłowa biblioteka języka Python do odczytu, edycji i aktualizacji metadanych dokumentów.
Czym jest Hachoir-metadata API dla Pythona?
hachoir-metadata to biblioteka Pythona, która jest częścią szerszego projektu Hachoir, zaprojektowanego do parsowania i wyodrębniania metadanych z szerokiej gamy typów plików. Dostarcza narzędzi do odczytu metadanych bez konieczności dekompresji lub pełnego dekodowania plików, dzięki czemu jest lekka i wydajna w przypadku podstawowych zadań inspekcji metadanych.
Funkcje API hachoir-metadata
hachoir-metadata is a powerful API that has rich features as follow:- Obsługa typów plików: obsługuje wiele formatów plików, w tym obrazy, filmy, pliki audio, archiwa i dokumenty.
- Ekstrakcja metadanych: wyodrębnia podstawowe metadane, takie jak rozmiar pliku, data utworzenia, data modyfikacji i inne właściwości specyficzne dla danego formatu (np. EXIF dla obrazów, kodeki dla filmów itp.).
- Operacje tylko do odczytu: koncentrują się na odczycie i sprawdzaniu metadanych bez modyfikowania oryginalnego pliku.
- Niezależność od typu pliku: automatycznie wykrywa typy plików i odpowiednio wyodrębnia metadane.
- Integracja: Możliwość integracji z aplikacjami Python w celu wykorzystania w procesach pracy, takich jak organizacja treści, analiza cyfrowa i systemy archiwizacji.
Tryby API hachoir-metadata
- tryb klasyczny: wyodrębnij metadane, możesz użyć –level=LEVEL, aby ograniczyć ilość wyświetlanych informacji (a nie wyodrębnianych)
- type: wyświetl w jednym wierszu format pliku i najważniejsze informacje
- mime: wyświetla tylko typ MIME pliku
Wprowadzenie do interfejsu API Hachoir dla języka Python
Aby używać Hachoir API dla Pythona, musisz zainstalować wersję Pythona 3.6+ i Hachoir na swoim systemie. Więc najpierw zainstaluj Python, a następnie użyj poniższych poleceń, aby zainstalować Hachoir API na swoim komputerze, używając pip i środowiska wirtualnego.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Praca z interfejsem API hachoir-metadata dla języka Python — przykłady
hachoir-metadata API dla Pythona pozwala na odczytywanie informacji metadanych z typów plików multimedialnych. Za pomocą zaledwie kilku linijek kodu możesz tworzyć potężne aplikacje, które mogą odczytywać informacje metadanych z różnych formatów plików. Poniższe przykłady kodu pokazują, jak można używać hachoir-metadata API w aplikacjach Pythona.
Praca z interfejsem API hachoir-metadata dla języka Python — przykłady
pyExifTool zapewnia wsparcie dla odczytu metadanych różnych formatów plików, takich jak PDF, BMP, JPEG, DOCX, XLSX i wiele innych. API pozwala na odczyt informacji metadanych pliku za pomocą metody get_metadata. Sprawdź poniższy fragment kodu, w którym odczytujemy informacje metadanych z pliku PDF.
Wyjście
Po wykonaniu tego kodu wynik będzie podobny do poniższego (w zależności od informacji dostępnych w pliku przykładowym):
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Wniosek
Interfejs API hachoir-metadata oferuje potężne, ale lekkie rozwiązanie do wyodrębniania metadanych z szerokiej gamy formatów plików, co czyni go doskonałym narzędziem dla programistów Pythona pracujących w takich dziedzinach jak informatyka śledcza, zarządzanie treścią i analiza danych. Jego zdolność do analizowania plików bez modyfikacji zapewnia integralność danych, a interfejs Pythonic upraszcza integrację z aplikacjami i przepływami pracy. Dzięki obsłudze różnych typów plików i właściwości metadanych, hachoir-metadata jest wszechstronnym wyborem do szybkiej i wydajnej inspekcji metadanych zarówno w projektach/systemach osobistych, jak i zawodowych.