Open Source Python PDF-metadatabibliotek
Gratis & open source Python-bibliotek til at læse og opdatere metadata af PDF-dokumenter.
Hvad er pypdf?
Pypdf er et alsidigt open source python-bibliotek kendt for sit mangfoldige sæt funktioner til PDF-manipulation. Dette bibliotek er praktisk til forskellige PDF-manipulationer såsom PDF-parsing og PDF-opdeling og -sammenlægning osv., men i denne produktanmeldelse vil vi kun fokusere på dets PDF-metadatastyringsfunktioner.
Følgende er de vigtigste funktioner i pypdf relateret til metadata:
- Læs PDF-metadata: Du kan læse egenskaber (såsom forfatter, skaber, producent, titel, emne og nøgleord) for PDF-dokumenter ved hjælp af pypdf.
- Opdater PDF-metadata: Du kan også opdatere metadata for PDF-dokumenter ved hjælp af pypdf.
Kom godt i gang med pypdf
Du skal bruge Python version 3.6.0 eller nyere for at installere og bruge pypdf. Så installer først Python og brug derefter nedenstående kommandoer til at installere pypdf på din maskine ved hjælp af pip og virtuelt miljø.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Læsning af metadata i PDF
Vi kan læse metadataene for et PDF-dokument ved hjælp af pypdf-biblioteket. Vi får metadataene for en PDF fra metadata-egenskaben for PdfReader-klassen i pypdf-biblioteket. Tjek nedenstående kodestykke for detaljer:
Produktion
Nedenstående skærmbillede viser metadataene for den leverede PDF-fil:
Opdatering af metadata for PDF
Vi kan også opdatere metadata af et PDF-dokument såsom forfatter, producent, emne og titel osv. ved hjælp af pypdf-biblioteket. Vi sender et objekt, der indeholder metadataoplysningerne, til add_metadata-metoden for PdfWriter-klassen i pypdf-biblioteket for at opdatere/skrive metadata for PDF-dokumentet. For detaljer, tjek nedenstående kodestykke:
Konklusion
Afslutningsvis viser pydf sig at være et enestående Python-bibliotek til læsning og opdatering af metadata af PDF-dokumenter. Udviklere kan nemt læse og opdatere metadata af PDF-dokumenter uden problemer.