Библиотека метаданных Python с открытым исходным кодом

Бесплатная библиотека Python с открытым исходным кодом для чтения, редактирования и обновления метаданных документов.

Что такое API Hachoir-metadata для Python?

hachoir-metadata — это библиотека Python, которая является частью более широкого проекта Hachoir, разработанного для анализа и извлечения метаданных из самых разных типов файлов. Она предоставляет инструменты для чтения метаданных без необходимости распаковывать или полностью декодировать файлы, что делает ее легкой и эффективной для основных задач проверки метаданных.

Возможности API hachoir-metadata

hachoir-metadata is a powerful API that has rich features as follow:
  • Поддержка типов файлов: работает со многими форматами файлов, включая изображения, видео, аудиофайлы, архивы и документы.
  • Извлечение метаданных: извлекает основные метаданные, такие как размер файла, дата создания, дата изменения и другие свойства, специфичные для формата (например, EXIF для изображений, кодеки для видео и т. д.).
  • Операции только для чтения: фокусируются на чтении и проверке метаданных без изменения исходного файла.
  • Независимость от типа файла: автоматически определяет типы файлов и извлекает метаданные соответствующим образом.
  • Интеграция: может быть интегрирован в приложения Python для использования в таких рабочих процессах, как организация контента, цифровая криминалистика и архивные системы.

Режимы API hachoir-metadata

  • классический режим: извлечение метаданных, можно использовать –level=LEVEL, чтобы ограничить количество отображаемой (и не извлекаемой) информации
  • type: показать в одной строке формат файла и наиболее важную информацию
  • mime: просто отображать тип MIME файла

Начало работы с API Hachoir для Python

GitHub

Статистика GitHub

Имя:
Язык:
Звезды:
Вилки:
Лицензия:
Репозиторий последний раз обновлялся на

Чтобы использовать API Hachoir для Python, вам необходимо установить Python 3.6+ и Hachoir в вашей системе. Поэтому сначала установите Python, а затем используйте команды ниже для установки API Hachoir на вашем компьютере с помощью pip и виртуальной среды.


pip install hachoir

Alternatively, you can also install hachoir from Github repository using the following steps:


1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]

Работа с API hachoir-metadata для Python — примеры

API hachoir-metadata для Python позволяет считывать метаданные из типов файлов мультимедиа. С помощью всего нескольких строк кода вы можете разрабатывать мощные приложения, которые могут считывать метаданные из различных форматов файлов. Следующие примеры кода показывают, как API hachoir-metadata можно использовать в приложениях Python.

Работа с API hachoir-metadata для Python — примеры

pyExifTool предоставляет вам поддержку для чтения метаданных различных форматов файлов, таких как PDF, BMP, JPEG, DOCX, XLSX и многих других. API позволяет вам читать метаданные файла с помощью метода get_metadata. Проверьте фрагмент кода ниже, где мы считываем метаданные из файла PDF.

Выход

При выполнении этого кода вывод будет примерно таким (в зависимости от информации, доступной в вашем файле примера):


Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian

Заключение

API hachoir-metadata предлагает мощное, но легкое решение для извлечения метаданных из самых разных форматов файлов, что делает его отличным инструментом для разработчиков Python, работающих в таких областях, как цифровая криминалистика, управление контентом и анализ данных. Его способность анализировать файлы без изменений гарантирует целостность данных, а его интерфейс Pythonic упрощает интеграцию в приложения и рабочие процессы. Благодаря поддержке различных типов файлов и свойств метаданных hachoir-metadata является универсальным выбором для быстрой и эффективной проверки метаданных как для личных, так и для профессиональных проектов/систем.

Похожие Продукты

 Русский