Atvērtā pirmkoda Python PDF metadatu bibliotēka
Bezmaksas un atvērtā pirmkoda Python bibliotēka, lai lasītu un atjauninātu PDF dokumentu metadatus.
Kas ir pypdf?
Pypdf ir daudzpusīga atvērtā pirmkoda python bibliotēka, kas pazīstama ar daudzveidīgo PDF manipulācijas funkciju kopumu. Šī bibliotēka ir noderīga dažādām PDF manipulācijām, piemēram, PDF parsēšanai un PDF sadalīšanai un apvienošanai. utt., taču šajā produkta pārskatā mēs koncentrēsimies tikai uz tā PDF metadatu pārvaldības funkcijām.
Tālāk ir norādītas galvenās pypdf funkcijas, kas saistītas ar metadatiem:
- Lasīt PDF metadatus: varat lasīt PDF dokumentu rekvizītus (piemēram, autoru, veidotāju, producentu, nosaukumu, tēmu un atslēgvārdus), izmantojot pypdf.
- PDF metadatu atjaunināšana: varat arī atjaunināt PDF dokumentu metadatus, izmantojot pypdf.
Darba sākšana ar pypdf
Lai instalētu un izmantotu pypdf, nepieciešama Python versija 3.6.0 vai jaunāka versija. Tāpēc vispirms instalējiet Python un pēc tam izmantojiet tālāk norādītās komandas, lai instalētu pypdf savā datorā, izmantojot pip un virtuālā vide.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
PDF metadatu lasīšana
Mēs varam lasīt PDF dokumenta metadatus, izmantojot pypdf bibliotēku. Mēs iegūsim PDF faila metadatus no klases PdfReader rekvizīta metadati pypdf bibliotēkā. Lai iegūtu sīkāku informāciju, pārbaudiet tālāk norādīto koda fragmentu.
Zemāk redzamajā ekrānuzņēmumā ir parādīti nodrošinātā PDF faila metadati:
PDF metadatu atjaunināšana
Mēs varam arī atjaunināt PDF dokumenta metadatus, piemēram, autoru, producentu, tēmu un nosaukumu utt., izmantojot pypdf bibliotēku. Mēs nosūtīsim objektu, kas satur metadatu informāciju, add_metadata klases PdfWriter metodei pypdf bibliotēkā, lai atjauninātu/rakstītu PDF dokumenta metadatus. Lai iegūtu sīkāku informāciju, pārbaudiet tālāk norādīto koda fragmentu.
Secinājums
Visbeidzot, pypdf izrādās izcila Python bibliotēka PDF dokumentu metadatu lasīšanai un atjaunināšanai. Izstrādātāji var viegli lasīt un atjaunināt PDF dokumentu metadatus bez problēmām.