Open Source Python PDF-metadatabibliotheek

Gratis en open source Python-bibliotheek om metagegevens van PDF-documenten te lezen en bij te werken.

Wat is pypdf?

Pypdf is een veelzijdige open source python bibliotheek die bekend staat om zijn diverse set aan functies voor PDF manipulatie. Deze bibliotheek is handig voor verschillende PDF manipulaties zoals PDF parsing en PDF splitting & merging etc. maar in deze product review zullen we ons alleen richten op de PDF metadata management functies.

Hieronder staan de belangrijkste kenmerken van pypdf met betrekking tot metadata:

PDF-metagegevens lezen: Met pypdf kunt u eigenschappen (zoals auteur, maker, producent, titel, onderwerp en trefwoorden) van PDF-documenten lezen.
PDF-metagegevens bijwerken: U kunt ook metagegevens van PDF-documenten bijwerken met behulp van pypdf.

GitHub-statistieken

Naam:
Taal:
Sterren:
Vorken:
Licentie:
De opslagplaats is voor het laatst bijgewerkt op

Aan de slag met pypdf

Je hebt Python versie 3.6.0 of hoger nodig om pypdf te installeren en gebruiken. Installeer dus eerst Python en gebruik dan onderstaande commando's om pypdf op je machine te installeren met pip en virtual environment.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

MacOS


python -m venv venv
source venv/bin/activate
pip install pypdf

Vensters


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Metadata van PDF lezen

We kunnen de metadata van een PDF-document lezen met behulp van de pypdf-bibliotheek. We halen de metadata van een PDF op uit de metadata-eigenschap van de PdfReader-klasse in de pypdf-bibliotheek. Bekijk het onderstaande codefragment voor meer informatie:

Uitvoer

De onderstaande schermafbeelding toont de metagegevens van het meegeleverde PDF-bestand:

Metagegevens van PDF bijwerken

We kunnen ook metadata van een PDF-document bijwerken, zoals auteur, producent, onderwerp en titel, etc. met behulp van de pypdf-bibliotheek. We geven een object met de metadata-informatie door aan de add_metadata-methode van de PdfWriter-klasse in de pypdf-bibliotheek om metadata van het PDF-document bij te werken/schrijven. Bekijk voor meer informatie het onderstaande codefragment:

Conclusie

Concluderend blijkt pypdf een uitzonderlijke Python-bibliotheek te zijn voor het lezen en updaten van metadata van PDF-documenten. Ontwikkelaars kunnen metadata van PDF-documenten eenvoudig lezen en updaten zonder problemen.