Библиотека метаданных Python с открытым исходным кодом
Бесплатная библиотека Python с открытым исходным кодом для чтения, редактирования и обновления метаданных документов.
Что такое API Hachoir-metadata для Python?
hachoir-metadata — это библиотека Python, которая является частью более широкого проекта Hachoir, разработанного для анализа и извлечения метаданных из самых разных типов файлов. Она предоставляет инструменты для чтения метаданных без необходимости распаковывать или полностью декодировать файлы, что делает ее легкой и эффективной для основных задач проверки метаданных.
Возможности API hachoir-metadata
hachoir-metadata is a powerful API that has rich features as follow:- Поддержка типов файлов: работает со многими форматами файлов, включая изображения, видео, аудиофайлы, архивы и документы.
- Извлечение метаданных: извлекает основные метаданные, такие как размер файла, дата создания, дата изменения и другие свойства, специфичные для формата (например, EXIF для изображений, кодеки для видео и т. д.).
- Операции только для чтения: фокусируются на чтении и проверке метаданных без изменения исходного файла.
- Независимость от типа файла: автоматически определяет типы файлов и извлекает метаданные соответствующим образом.
- Интеграция: может быть интегрирован в приложения Python для использования в таких рабочих процессах, как организация контента, цифровая криминалистика и архивные системы.
Режимы API hachoir-metadata
- классический режим: извлечение метаданных, можно использовать –level=LEVEL, чтобы ограничить количество отображаемой (и не извлекаемой) информации
- type: показать в одной строке формат файла и наиболее важную информацию
- mime: просто отображать тип MIME файла
Начало работы с API Hachoir для Python
Чтобы использовать API Hachoir для Python, вам необходимо установить Python 3.6+ и Hachoir в вашей системе. Поэтому сначала установите Python, а затем используйте команды ниже для установки API Hachoir на вашем компьютере с помощью pip и виртуальной среды.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Работа с API hachoir-metadata для Python — примеры
API hachoir-metadata для Python позволяет считывать метаданные из типов файлов мультимедиа. С помощью всего нескольких строк кода вы можете разрабатывать мощные приложения, которые могут считывать метаданные из различных форматов файлов. Следующие примеры кода показывают, как API hachoir-metadata можно использовать в приложениях Python.
Работа с API hachoir-metadata для Python — примеры
pyExifTool предоставляет вам поддержку для чтения метаданных различных форматов файлов, таких как PDF, BMP, JPEG, DOCX, XLSX и многих других. API позволяет вам читать метаданные файла с помощью метода get_metadata. Проверьте фрагмент кода ниже, где мы считываем метаданные из файла PDF.
Выход
При выполнении этого кода вывод будет примерно таким (в зависимости от информации, доступной в вашем файле примера):
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Заключение
API hachoir-metadata предлагает мощное, но легкое решение для извлечения метаданных из самых разных форматов файлов, что делает его отличным инструментом для разработчиков Python, работающих в таких областях, как цифровая криминалистика, управление контентом и анализ данных. Его способность анализировать файлы без изменений гарантирует целостность данных, а его интерфейс Pythonic упрощает интеграцию в приложения и рабочие процессы. Благодаря поддержке различных типов файлов и свойств метаданных hachoir-metadata является универсальным выбором для быстрой и эффективной проверки метаданных как для личных, так и для профессиональных проектов/систем.
Похожие Продукты
- pdf-lib для JavaScript | Легкое управление метаданными PDF
- pyExifTool | API Python с открытым исходным кодом для метаданных документов
- pypdf | Библиотека Python для управления метаданными PDF
- tika-python | API Python с открытым исходным кодом для метаданных документов
- Библиотека Python PyMuPDF для метаданных PDF | Открытый исходный код