Atvirojo kodo Python PDF metaduomenų biblioteka
Nemokama ir atvirojo kodo Python biblioteka, skirta skaityti ir atnaujinti PDF dokumentų metaduomenis.
Kas yra pypdf?
Pypdf yra universali atvirojo kodo python biblioteka, žinoma dėl įvairių PDF manipuliavimo funkcijų rinkinio. Ši biblioteka pravers atliekant įvairias PDF manipuliacijas, pvz., PDF analizę ir PDF skaidymą ir sujungimą ir pan., tačiau šioje produkto apžvalgoje daugiausia dėmesio skirsime tik jo PDF metaduomenų valdymo funkcijoms.
Toliau pateikiamos pagrindinės pypdf funkcijos, susijusios su metaduomenimis:
- Skaityti PDF metaduomenis: naudodami pypdf galite skaityti PDF dokumentų ypatybes (pvz., autorių, kūrėją, gamintoją, pavadinimą, temą ir raktinius žodžius).
- Atnaujinti PDF metaduomenis: taip pat galite atnaujinti PDF dokumentų metaduomenis naudodami pypdf.
Darbo pradžia su pypdf
Norint įdiegti ir naudoti pypdf, reikia 3.6.0 ar naujesnės Python versijos. Taigi pirmiausia įdiekite Python, o tada naudokite toliau pateiktas komandas, kad įdiegtumėte pypdf savo kompiuteryje naudodami pip ir virtuali aplinka.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Skaityti PDF metaduomenis
Naudodami pypdf biblioteką galime nuskaityti PDF dokumento metaduomenis. PDF failo metaduomenis gausime iš pypdf bibliotekos klasės PdfReader nuosavybės metaduomenys. Norėdami gauti daugiau informacijos, patikrinkite toliau pateiktą kodo fragmentą:
Žemiau esančioje ekrano kopijoje rodomi pateikto PDF failo metaduomenys:
PDF metaduomenų atnaujinimas
Taip pat galime atnaujinti PDF dokumento metaduomenis, pvz., autorių, gamintoją, temą ir pavadinimą ir pan., naudodami pypdf biblioteką. Objektą, kuriame yra metaduomenų informacija, perduosime pypdf bibliotekos PdfWriter klasės metodui add_metadata, kad būtų atnaujinti / įrašyti PDF dokumento metaduomenys. Norėdami gauti daugiau informacijos, patikrinkite toliau pateiktą kodo fragmentą:
Išvada
Apibendrinant galima pasakyti, kad pypdf yra išskirtinė Python biblioteka, skirta skaityti ir atnaujinti PDF dokumentų metaduomenis. Kūrėjai gali lengvai skaityti ir atnaujinti PDF dokumentų metaduomenis be jokių problemų.