Бібліотека метаданих Python з відкритим кодом

Безкоштовна бібліотека Python із відкритим кодом для читання, редагування й оновлення метаданих документів.

Що таке Hachoir-metadata API для Python?

hachoir-metadata — це бібліотека Python, яка є частиною ширшого проекту Hachoir, розробленого для аналізу та вилучення метаданих із різноманітних файлів види. Він надає інструменти для читання метаданих без необхідності розпаковувати або повністю декодувати файли, що робить його легким і ефективним для основних завдань перевірки метаданих.

Особливості hachoir-metadata API

hachoir-metadata is a powerful API that has rich features as follow:
  • Підтримка типів файлів: працює з багатьма форматами файлів, включаючи зображення, відео, аудіофайли, архіви та документи.
  • Вилучення метаданих: витягує основні метадані, такі як розмір файлу, дата створення, дата модифікації та інші властивості, що стосуються формату (наприклад, EXIF для зображень, кодеки для відео тощо).
  • Операції лише для читання: фокусується на читанні та перевірці метаданих без зміни вихідного файлу.
  • Агностика типу файлу: автоматично визначає типи файлів і відповідно витягує метадані.
  • Інтеграція: можна інтегрувати в програми Python для використання в робочих процесах, таких як організація вмісту, цифрова криміналістика та архівні системи.

Режими hachoir-метаданих API

  • класичний режим: витяг метаданих, ви можете використовувати –level=LEVEL, щоб обмежити кількість інформації для відображення (а не для вилучення)
  • type: показує в одному рядку формат файлу та найважливішу інформацію
  • mime: просто відобразити тип файлу MIME

Початок роботи з Hachoir API для Python

GitHub

Статистика GitHub

Ім'я:
Мова:
зірки:
Вилки:
Ліцензія:
Репозиторій востаннє оновлено о

Щоб використовувати Hachoir API для Python, вам потрібно встановити Python 3.6+ версії та Hachoir у вашій системі. Отже, спочатку встановіть Python, а потім скористайтеся наведеними нижче командами, щоб установити Hachoir API на вашій машині за допомогою pip і віртуальне середовище.


pip install hachoir

Alternatively, you can also install hachoir from Github repository using the following steps:


1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]

Робота з hachoir-metadata API для Python – приклади

hachoir-metadata API для Python дозволяє читати метадані з типів медіафайлів. За допомогою лише кількох рядків коду ви можете розробити потужні програми, які можуть зчитувати метадані з різних форматів файлів. Наведені нижче зразки коду показують, як API метаданих hachoir можна використовувати в програмах Python.

Робота з hachoir-metadata API для Python – приклади

pyExifTool підтримує читання метаданих різноманітних форматів файлів, таких як PDF, BMP, JPEG, DOCX, XLSX та багато інших. API дозволяє читати метадані файлу за допомогою методу get_metadata. Перевірте наведений нижче фрагмент коду, де ми зчитуємо інформацію метаданих із файлу PDF.

Вихід

Коли ви виконуєте цей код, результат буде дещо схожий на наведений нижче (залежно від інформації, доступної у вашому файлі зразка:


Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian

Висновок

API метаданих hachoir пропонує потужне, але легке рішення для вилучення метаданих із різноманітних форматів файлів, що робить його чудовим інструментом для розробників Python, які працюють у таких сферах, як цифрова криміналістика, керування вмістом та аналіз даних. Його здатність аналізувати файли без змін забезпечує цілісність даних, а його інтерфейс Pythonic спрощує інтеграцію в програми та робочі процеси. Завдяки підтримці різних типів файлів і властивостей метаданих hachoir-metadata є універсальним вибором для швидкої та ефективної перевірки метаданих як для особистих, так і для професійних проектів/систем.

Подібні Продукти

 Ukrainian