Open Source Python PDF-metagegevensbibliotheek
Gratis en open source Python-bibliotheek om metadata van PDF-documenten te lezen en bij te werken.
Wat is pypdf?
Pypdf is een veelzijdige open source Python-bibliotheek die bekend staat om zijn gevarieerde reeks functies voor PDF-manipulatie. Deze bibliotheek is handig voor diverse PDF-manipulaties, zoals PDF-parsing en PDF splitsen en samenvoegen etc. maar in deze productrecensie zullen we ons alleen concentreren op de functies voor het beheer van PDF-metagegevens.
Hieronder volgen de belangrijkste kenmerken van pypdf met betrekking tot metadata:
- PDF-metagegevens lezen: u kunt eigenschappen (zoals auteur, maker, producent, titel, onderwerp en trefwoorden) van PDF-documenten lezen met pypdf.
- PDF-metagegevens bijwerken: u kunt ook metagegevens van PDF-documenten bijwerken met pypdf.
Aan de slag met pypdf
Je hebt Python versie 3.6.0 of hoger nodig om pypdf te installeren en te gebruiken. Installeer dus eerst Python en gebruik vervolgens de onderstaande opdrachten om pypdf op uw computer te installeren met behulp van pip en virtuele omgeving.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
ramen
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Metagegevens van PDF lezen
We kunnen de metadata van een PDF-document lezen met behulp van de pypdf-bibliotheek. We halen de metagegevens van een PDF uit de eigenschap metadata van de klasse PdfReader in de pypdf-bibliotheek. Controleer het onderstaande codefragment voor meer informatie:
Onderstaande schermafbeelding toont de metadata van het meegeleverde PDF-bestand:
Metagegevens van PDF bijwerken
We kunnen ook de metadata van een PDF-document bijwerken, zoals auteur, producent, onderwerp en titel enz. met behulp van de pypdf-bibliotheek. We zullen een object dat de metadata-informatie bevat doorgeven aan de add_metadata methode van de PdfWriter klasse in de pypdf-bibliotheek om metadata van het PDF-document bij te werken/schrijven. Bekijk het onderstaande codefragment voor meer informatie:
Conclusie
Concluderend blijkt pypdf een uitzonderlijke Python-bibliotheek te zijn voor het lezen en bijwerken van metadata van PDF-documenten. Ontwikkelaars kunnen metagegevens van PDF-documenten eenvoudig en zonder problemen lezen en bijwerken.