Бібліотека метаданих Python з відкритим кодом
Безкоштовна бібліотека Python із відкритим кодом для читання, редагування й оновлення метаданих документів.
Що таке pyExifTool?
Бібліотека Python pyExifTool — це легка обгортка популярної утиліти ExifTool, що дозволяє користувачам програмно взаємодіяти з метаданими файлів. Завдяки підтримці різних форматів файлів, зокрема PDF-файлів, зображень, відео та аудіофайлів, pyexiftool надає можливість читати, записувати та видаляти метадані за допомогою потужних функцій ExifTool. Бібліотека розроблена для використання можливостей командного рядка ExifTool, пропонуючи інтерфейс Pythonic для простоти використання. На цій сторінці ми обговоримо, як розробники можуть використовувати API pyExifTool у своїх програмах Python для роботи з метаданими файлів.
Початок роботи з pyExifTool
Щоб отримати pyExifTool, вам потрібно встановити Python 3.6+ версії та ExifTool у вашій системі. Отже, спочатку встановіть Python, а потім скористайтеся наведеними нижче командами, щоб установити pyExifTool на вашому комп’ютері за допомогою pip і віртуальне середовище.
python -m pip install -U pyexiftool
1. Checkout the source code from Github repository git clone git://github.com/sylikc/pyexiftool.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Читання метаданих PDF та інших файлів
pyExifTool підтримує читання метаданих різноманітних форматів файлів, таких як PDF, BMP, JPEG, DOCX, XLSX та багато інших. API дозволяє читати метадані файлу за допомогою методу get_metadata. Перевірте наведений нижче фрагмент коду, де ми зчитуємо інформацію метаданих із файлу PDF.
Вихід
На знімку екрана нижче показано метадані PDF-файлу:
Оновлення метаданих PDF та інших форматів файлів
Ви також можете оновити метадані PDF або будь-якого іншого документа за допомогою pyExifTool. Інструмент дозволяє оновлювати поля метаданих, такі як автор, виробник, тема, назва тощо, встановлюючи теги. Це показано в наступному зразку коду.
Висновок
Підсумовуючи, pyExifTool Python — це потужна бібліотека Python для читання та оновлення метаданих різних типів документів. Він заснований на ExifTool, який підтримує кілька форматів файлів для читання/запису метаданих. Розробники додатків Python можуть використовувати його для розробки програм, які можуть легко читати та писати метадані документа.