Open Source Python PDF-metadatabibliotek
Gratis og åpen kildekode Python-bibliotek for å lese og oppdatere metadata av PDF-dokumenter.
Hva er pypdf?
Pypdf er et allsidig åpen kildekode python-bibliotek kjent for sitt mangfoldige sett med funksjoner for PDF-manipulering. Dette biblioteket er nyttig for ulike PDF-manipulasjoner som PDF-parsing og PDF-deling og -sammenslåing osv., men i denne produktanmeldelsen vil vi kun fokusere på funksjonene for administrasjon av PDF-metadata.
Følgende er hovedtrekkene til pypdf relatert til metadata:
- Les PDF-metadata: Du kan lese egenskaper (som forfatter, skaper, produsent, tittel, emne og nøkkelord) til PDF-dokumenter ved å bruke pypdf.
- Oppdater PDF-metadata: Du kan også oppdatere metadata for PDF-dokumenter ved å bruke pypdf.
Komme i gang med pypdf
Du trenger Python versjon 3.6.0 eller høyere for å installere og bruke pypdf. Så installer først Python og bruk deretter kommandoene nedenfor for å installere pypdf på maskinen din ved å bruke pip og virtuelt miljø a>.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
Mac os
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Lese metadata av PDF
Vi kan lese metadataene til et PDF-dokument ved å bruke pypdf-biblioteket. Vi vil hente metadataene til en PDF fra metadata-egenskapen til PdfReader-klassen i pypdf-biblioteket. Sjekk kodebiten nedenfor for detaljer:
Skjermbildet nedenfor viser metadataene til den oppgitte PDF-filen:
Oppdatering av metadata for PDF
Vi kan også oppdatere metadata til et PDF-dokument som forfatter, produsent, emne og tittel etc. ved å bruke pypdf-biblioteket. Vi sender et objekt som inneholder metadatainformasjonen til add_metadata-metoden for PdfWriter-klassen i pypdf-biblioteket for å oppdatere/skrive metadata for PDF-dokumentet. For detaljer, sjekk kodebiten nedenfor:
Konklusjon
Avslutningsvis viser pydf seg å være et eksepsjonelt Python-bibliotek for lesing og oppdatering av metadata av PDF-dokumenter. Utviklere kan enkelt lese og oppdatere metadata av PDF-dokumenter uten problemer.