Библиотека с PDF метаданни на Python с отворен код

Безплатна библиотека на Python с отворен код за четене и актуализиране на метаданни на PDF документи.

Какво е pypdf?

Pypdf е многофункционална библиотека на Python с отворен код, известна с разнообразния си набор от функции за манипулиране на PDF. Тази библиотека наистина е полезна за различни манипулации на PDF като синтактичен анализ на PDF и разделяне и обединяване на PDF и т.н., но в този преглед на продукта ще се съсредоточим само върху неговите функции за управление на PDF метаданни.

Следват основните характеристики на pypdf, свързани с метаданните:

  • Четене на PDF метаданни: Можете да четете свойства (като автор, създател, продуцент, заглавие, тема и ключови думи) на PDF документи с помощта на pypdf.
  • Актуализиране на PDF метаданни: Можете също да актуализирате метаданни на PDF документи с помощта на pypdf.
GitHub

Статистика на GitHub

Име:
език:
звезди:
Вилици:
Разрешително:
Хранилището е последно актуализирано на

Първи стъпки с pypdf

Имате нужда от Python версия 3.6.0 или по-нова, за да инсталирате и използвате pypdf. И така, първо инсталирайте Python и след това използвайте командите по-долу, за да инсталирате pypdf на вашата машина, като използвате pip и виртуална среда.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

MacOS


python -m venv venv
source venv/bin/activate
pip install pypdf

Windows


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Четене на метаданни на PDF

Можем да прочетем метаданните на PDF документ с помощта на библиотеката pypdf. Ще получим метаданните на PDF от свойството metadata на класа PdfReader в библиотеката pypdf. Проверете кодовия фрагмент по-долу за подробности:

Изход

Екранната снимка по-долу показва метаданните на предоставения PDF файл:

Актуализиране на метаданни на PDF

Можем също така да актуализираме метаданни на PDF документ като автор, продуцент, тема и заглавие и т.н. с помощта на библиотеката pypdf. Ще предадем обект, съдържащ информацията за метаданни, към метода add_metadata на класа PdfWriter в библиотеката pypdf, за да актуализираме/запишем метаданни на PDF документа. За подробности проверете кодовия фрагмент по-долу:

Заключение

В заключение, pypdf се оказва изключителна библиотека на Python за четене и актуализиране на метаданни на PDF документи. Разработчиците могат лесно да четат и актуализират метаданни на PDF документи без никакви проблеми.

Подобни Продукти

 Bulgarian