Open-Source-Python-PDF-Metadatenbibliothek
Kostenlose und quelloffene Python-Bibliothek zum Lesen und Aktualisieren von Metadaten von PDF-Dokumenten.
Was ist pypdf?
Pypdf ist eine vielseitige Open-Source-Python-Bibliothek, die für ihre vielfältigen Funktionen zur PDF-Bearbeitung bekannt ist. Diese Bibliothek ist praktisch für verschiedene PDF-Manipulationen wie das PDF-Parsing und das PDF-Teilen und Zusammenführen usw., aber in diesem Produkttest konzentrieren wir uns nur auf die PDF-Metadaten-Verwaltungsfunktionen.
Im Folgenden sind die Hauptfunktionen von pypdf im Zusammenhang mit Metadaten aufgeführt:
- PDF-Metadaten lesen: Sie können Eigenschaften (wie Autor, Ersteller, Produzent, Titel, Betreff und Schlüsselwörter) von PDF-Dokumenten mit pypdf lesen.
- PDF-Metadaten aktualisieren: Sie können Metadaten von PDF-Dokumenten auch mit pypdf aktualisieren.
Erste Schritte mit pypdf
Sie benötigen Python Version 3.6.0 oder höher, um pypdf zu installieren und zu verwenden. Installieren Sie also zuerst Python und verwenden Sie dann die folgenden Befehle, um pypdf mit pip und virtuelle Umgebung.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
Mac OS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Metadaten von PDF lesen
Wir können die Metadaten eines PDF-Dokuments mithilfe der pypdf-Bibliothek lesen. Wir erhalten die Metadaten einer PDF-Datei aus der Eigenschaft metadata der Klasse PdfReader in der pypdf-Bibliothek. Weitere Informationen finden Sie im folgenden Codeausschnitt:
Ausgabe
Der folgende Screenshot zeigt die Metadaten der bereitgestellten PDF-Datei:
Aktualisieren der Metadaten von PDF
Mit der pypdf-Bibliothek können wir auch Metadaten eines PDF-Dokuments wie Autor, Produzent, Betreff und Titel usw. aktualisieren. Wir übergeben ein Objekt, das die Metadateninformationen enthält, an die Methode add_metadata der Klasse PdfWriter in der pypdf-Bibliothek, um Metadaten des PDF-Dokuments zu aktualisieren/schreiben. Weitere Informationen finden Sie im folgenden Codeausschnitt:
Abschluss
Zusammenfassend erweist sich pypdf als außergewöhnliche Python-Bibliothek zum Lesen und Aktualisieren von Metadaten von PDF-Dokumenten. Entwickler können Metadaten von PDF-Dokumenten problemlos lesen und aktualisieren.