Библиотека с PDF метаданни на Python с отворен код
Безплатна библиотека на Python с отворен код за четене и актуализиране на метаданни на PDF документи.
Какво е pypdf?
Pypdf е многофункционална библиотека на Python с отворен код, известна с разнообразния си набор от функции за манипулиране на PDF. Тази библиотека наистина е полезна за различни манипулации на PDF като синтактичен анализ на PDF и разделяне и обединяване на PDF и т.н., но в този преглед на продукта ще се съсредоточим само върху неговите функции за управление на PDF метаданни.
Следват основните характеристики на pypdf, свързани с метаданните:
- Четене на PDF метаданни: Можете да четете свойства (като автор, създател, продуцент, заглавие, тема и ключови думи) на PDF документи с помощта на pypdf.
- Актуализиране на PDF метаданни: Можете също да актуализирате метаданни на PDF документи с помощта на pypdf.
Първи стъпки с pypdf
Имате нужда от Python версия 3.6.0 или по-нова, за да инсталирате и използвате pypdf. И така, първо инсталирайте Python и след това използвайте командите по-долу, за да инсталирате pypdf на вашата машина, като използвате pip и виртуална среда.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Четене на метаданни на PDF
Можем да прочетем метаданните на PDF документ с помощта на библиотеката pypdf. Ще получим метаданните на PDF от свойството metadata на класа PdfReader в библиотеката pypdf. Проверете кодовия фрагмент по-долу за подробности:
Изход
Екранната снимка по-долу показва метаданните на предоставения PDF файл:
Актуализиране на метаданни на PDF
Можем също така да актуализираме метаданни на PDF документ като автор, продуцент, тема и заглавие и т.н. с помощта на библиотеката pypdf. Ще предадем обект, съдържащ информацията за метаданни, към метода add_metadata на класа PdfWriter в библиотеката pypdf, за да актуализираме/запишем метаданни на PDF документа. За подробности проверете кодовия фрагмент по-долу:
Заключение
В заключение, pypdf се оказва изключителна библиотека на Python за четене и актуализиране на метаданни на PDF документи. Разработчиците могат лесно да четат и актуализират метаданни на PDF документи без никакви проблеми.