Бібліотека метаданих Python PDF з відкритим кодом
Безкоштовна бібліотека Python із відкритим вихідним кодом для читання й оновлення метаданих PDF-документів.
Що таке pypdf?
Pypdf — це універсальна бібліотека Python з відкритим кодом, відома своїм різноманітним набором функцій для роботи з PDF-файлами. Ця бібліотека стає в нагоді для різноманітних маніпуляцій із PDF-файлами, як-от синтаксичного аналізу PDF-файлів і розділення та об’єднання PDF-файлів тощо, але в цьому огляді продукту ми зосередимося лише на його функціях керування метаданими PDF.
Нижче наведено основні функції pypdf, пов’язані з метаданими:
- Читання метаданих PDF: за допомогою pypdf можна читати властивості (наприклад, автора, творця, виробника, назву, тему та ключові слова) документів PDF.
- Оновити метадані PDF: ви також можете оновити метадані PDF-документів за допомогою pypdf.
Початок роботи з pypdf
Для встановлення та використання pypdf вам потрібна версія Python 3.6.0 або новіша. Отже, спочатку встановіть Python, а потім використовуйте наведені нижче команди, щоб установити pypdf на ваш комп’ютер за допомогою pip і віртуальне середовище.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
вікна
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Читання метаданих PDF
Ми можемо читати метадані PDF-документа за допомогою бібліотеки pypdf. Ми отримаємо метадані PDF із властивості metadata класу PdfReader у бібліотеці pypdf. Подробиці перевірте у наведеному нижче фрагменті коду.
На знімку екрана нижче показано метадані наданого файлу PDF:
Оновлення метаданих PDF
Ми також можемо оновити метадані PDF-документа, наприклад автора, виробника, тему та назву тощо, використовуючи бібліотеку pypdf. Ми передамо об’єкт, що містить інформацію про метадані, до методу add_metadata класу PdfWriter у бібліотеці pypdf, щоб оновити/записати метадані документа PDF. Щоб дізнатися більше, перегляньте наведений нижче фрагмент коду:
Висновок
Підсумовуючи, pypdf виявляється винятковою бібліотекою Python для читання та оновлення метаданих документів PDF. Розробники можуть легко читати та оновлювати метадані документів PDF без проблем.