Бібліотека анотацій PDF Python з відкритим кодом

Спробуйте цю безкоштовну бібліотеку Python із відкритим вихідним кодом для додавання та вилучення анотацій із документів PDF.

Що таке pypdf?

Pypdf — це безкоштовна бібліотека Python із відкритим вихідним кодом, відома своїм різноманітним набором функцій для обробки документів PDF у середовищі Python. Цей інструмент дуже корисний для різноманітних маніпуляцій із PDF-файлами, але в цьому огляді ми зосередимося на його функціях, пов’язаних із анотаціями.

Відомі особливості pypdf, пов’язані з анотаціями, включають:

  • Додавання приміток до фігур: ми можемо малювати такі фігури, як лінії, прямокутники, еліпси та багатокутники тощо, на певних ділянках сторінок PDF як примітки.
  • Додавання текстових анотацій: ми можемо додавати текстові анотації до певних позицій сторінок PDF.
  • Додавання анотацій посилань: можна також додавати анотації посилань (наприклад, гіперпосилання) до документів PDF.
  • Вилучення анотацій: ми можемо повторювати та витягувати інформацію про всі анотації в документі PDF за допомогою бібліотеки pypdf.
GitHub

Статистика GitHub

Ім'я:
Мова:
зірки:
Вилки:
Ліцензія:
Репозиторій востаннє оновлено о

Початок роботи з pypdf

Для встановлення та використання pypdf вам потрібна версія Python 3.6.0 або новіша. Отже, спочатку встановіть Python, а потім скористайтеся наведеними нижче командами, щоб установити pypdf на ваш комп’ютер за допомогою pip і віртуальне середовище.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

MacOS


python -m venv venv
source venv/bin/activate
pip install pypdf

вікна


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Додати прямокутну анотацію до PDF

Ми можемо додавати прямокутні анотації до документів PDF за допомогою бібліотеки pypdf. Для визначення прямокутника ми використаємо клас Rectangle модуля pypdf.annotations з бібліотеки pypdf. Потім ми використаємо метод add_annotations класу PDFWriter, щоб додати прямокутну анотацію до PDF-файлу.

Подробиці дивіться у фрагменті коду нижче:

Вихід

На знімку екрана нижче ви можете побачити, що прямокутник додано до слова Open Source:

Додати текстову анотацію до PDF

Ми створюємо текстові анотації за допомогою класу Text із модуля pypdf.annotations бібліотеки pypdf. Після цього ми можемо використовувати метод add_annotations класу PDFWriter з бібліотеки pypdf, щоб додати анотацію до PDF-файлу. Текстову анотацію додається як піктограму, яка розгортається та відображає текст, коли натиснути піктограму. Подробиці дивіться у фрагменті коду нижче:

Вихід

Як ми бачимо на наведеному нижче скрінкасті, код вище додає піктограму до PDF-файлу у вказаній позиції, яка показує текстову анотацію, коли натискається піктограма:

Додати анотацію посилання до PDF

Анотації посилань створюються за допомогою класу Link із модуля pypdf.annotations. Однак проблема з анотацією посилання полягає в тому, що вона лише додає посилання, але не відображається. Щоб вирішити цю проблему, ми включимо прямокутник за допомогою класу Rectangle з модуля pypdf.annotations, як ми пояснювали раніше. Таким чином, користувач може візуально визначити місце, де додається анотація посилання. Перегляньте наведений нижче фрагмент коду для кращого розуміння:

Вихід

Як ми бачимо у виведених даних, прямокутник служить областю, яка при клацанні перенаправляє користувача на вказане посилання.

Витягти анотації з PDF

Ми можемо отримати анотації з PDF за допомогою бібліотеки pypdf. Ми переглядаємо всі анотації на сторінках PDF, а потім використовуємо метод get_object, щоб отримати об’єкт анотації. Потім ми витягуємо релевантну інформацію з об’єкта. Подробиці дивіться у фрагменті коду нижче:

Вихід

Як ми бачимо на знімку екрана нижче, програма повернула тип анотації та координати анотацій у PDF-документі:

Висновок

Pypdf дає змогу розробникам Python додавати різні типи анотацій до PDF-файлів і отримувати доступ до важливої інформації про анотації, як-от їхній тип і розташування, що робить його практичним вибором для завдань, які вимагають додавання анотацій і отримання даних про анотації.

Подібні Продукти

 Ukrainian