Бібліотека метаданих Python PDF з відкритим кодом

Безкоштовна бібліотека Python із відкритим вихідним кодом для читання й оновлення метаданих PDF-документів.

Що таке pypdf?

Pypdf — це універсальна бібліотека Python з відкритим кодом, відома своїм різноманітним набором функцій для роботи з PDF-файлами. Ця бібліотека стає в нагоді для різноманітних маніпуляцій із PDF-файлами, як-от синтаксичного аналізу PDF-файлів і розділення та об’єднання PDF-файлів тощо, але в цьому огляді продукту ми зосередимося лише на його функціях керування метаданими PDF.

Нижче наведено основні функції pypdf, пов’язані з метаданими:

  • Читання метаданих PDF: за допомогою pypdf можна читати властивості (наприклад, автора, творця, виробника, назву, тему та ключові слова) документів PDF.
  • Оновити метадані PDF: ви також можете оновити метадані PDF-документів за допомогою pypdf.
GitHub

Статистика GitHub

Ім'я:
Мова:
зірки:
Вилки:
Ліцензія:
Репозиторій востаннє оновлено о

Початок роботи з pypdf

Для встановлення та використання pypdf вам потрібна версія Python 3.6.0 або новіша. Отже, спочатку встановіть Python, а потім використовуйте наведені нижче команди, щоб установити pypdf на ваш комп’ютер за допомогою pip і віртуальне середовище.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

MacOS


python -m venv venv
source venv/bin/activate
pip install pypdf

вікна


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Читання метаданих PDF

Ми можемо читати метадані PDF-документа за допомогою бібліотеки pypdf. Ми отримаємо метадані PDF із властивості metadata класу PdfReader у бібліотеці pypdf. Подробиці перевірте у наведеному нижче фрагменті коду.

На знімку екрана нижче показано метадані наданого файлу PDF:

Оновлення метаданих PDF

Ми також можемо оновити метадані PDF-документа, наприклад автора, виробника, тему та назву тощо, використовуючи бібліотеку pypdf. Ми передамо об’єкт, що містить інформацію про метадані, до методу add_metadata класу PdfWriter у бібліотеці pypdf, щоб оновити/записати метадані документа PDF. Щоб дізнатися більше, перегляньте наведений нижче фрагмент коду:

Висновок

Підсумовуючи, pypdf виявляється винятковою бібліотекою Python для читання та оновлення метаданих документів PDF. Розробники можуть легко читати та оновлювати метадані документів PDF без проблем.

Подібні Продукти

 Ukrainian