Библиотека с метаданни на Python с отворен код
Безплатна библиотека на Python с отворен код за четене, редактиране и актуализиране на метаданни на документи.
Какво представлява API за метаданни на Hachoir за Python?
hachoir-metadata е библиотека на Python, която е част от по-широкия проект Hachoir, предназначен за анализиране и извличане на метаданни от голямо разнообразие от файлове видове. Той предоставя инструменти за четене на метаданни, без да е необходимо да декомпресирате или напълно декодирате файловете, което го прави лек и ефективен за основни задачи за проверка на метаданни.
Характеристики на API за метаданни на hachoir
hachoir-metadata is a powerful API that has rich features as follow:- Поддръжка на типове файлове: Работи с много файлови формати, включително изображения, видеоклипове, аудио файлове, архиви и документи.
- Извличане на метаданни: Извлича основни метаданни като размер на файла, дата на създаване, дата на модификация и повече специфични за формата свойства (напр. EXIF за изображения, кодеци за видеоклипове и др.).
- Операции само за четене: Фокусира се върху четене и проверка на метаданни, без да променя оригиналния файл.
- Агностика на типа файл: Автоматично открива типове файлове и съответно извлича метаданни.
- Интеграция: Може да се интегрира в приложения на Python за използване в работни потоци като организация на съдържанието, дигитална криминалистика и архивни системи.
Режими на API за метаданни на hachoir
- класически режим: извличане на метаданни, можете да използвате –level=LEVEL, за да ограничите количеството информация за показване (а не за извличане)
- type: показва на един ред файловия формат и най-важната информация
- mime: показва само MIME тип файл
Първи стъпки с Hachoir API за Python
За да използвате Hachoir API за Python, трябва да инсталирате Python 3.6+ версия и Hachoir на вашата система. И така, първо инсталирайте Python и след това използвайте командите по-долу, за да инсталирате Hachoir API на вашата машина чрез pip и виртуална среда.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Работа с API на hachoir-metadata за Python - Примери
API на hachoir-metadata за Python ви позволява да четете информацията за метаданни от типове медийни файлове. Само с няколко реда код можете да разработите мощни приложения, които могат да четат информация за метаданни от различни файлови формати. Следните примерни кодове показват как може да се използва API за метаданни на hachoir в приложения на Python.
Работа с API на hachoir-metadata за Python - Примери
pyExifTool ви предоставя поддръжка за четене на метаданни от различни файлови формати като PDF, BMP, JPEG, DOCX, XLSX и много други. API ви позволява да четете информацията за метаданни на файл, като използвате метода get_metadata. Проверете кодовия фрагмент по-долу, където четем информацията за метаданни от PDF файл.
Изход
Когато изпълните този код, изходът ще бъде донякъде подобен на следния (в зависимост от информацията, налична във вашия примерен файл:
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Заключение
API на hachoir-metadata предлага мощно, но леко решение за извличане на метаданни от голямо разнообразие от файлови формати, което го прави отличен инструмент за разработчици на python, работещи в области като цифрова криминалистика, управление на съдържание и анализ на данни. Способността му да анализира файлове без модификация гарантира целостта на данните, докато Pythonic интерфейсът опростява интегрирането в приложения и работни процеси. С поддръжка за различни типове файлове и свойства на метаданни, hachoir-metadata е универсален избор за бърза и ефективна проверка на метаданни както за лични, така и за професионални проекти/системи.