Open-Source-Python-PDF-Metadatenbibliothek

Kostenlose und quelloffene Python-Bibliothek zum Lesen und Aktualisieren von Metadaten von PDF-Dokumenten.

Was ist pypdf?

Pypdf ist eine vielseitige Open-Source-Python-Bibliothek, die für ihre vielfältigen Funktionen zur PDF-Bearbeitung bekannt ist. Diese Bibliothek ist praktisch für verschiedene PDF-Manipulationen wie das PDF-Parsing und das PDF-Teilen und Zusammenführen usw., aber in diesem Produkttest konzentrieren wir uns nur auf die PDF-Metadaten-Verwaltungsfunktionen.

Im Folgenden sind die Hauptfunktionen von pypdf im Zusammenhang mit Metadaten aufgeführt:

  • PDF-Metadaten lesen: Sie können Eigenschaften (wie Autor, Ersteller, Produzent, Titel, Betreff und Schlüsselwörter) von PDF-Dokumenten mit pypdf lesen.
  • PDF-Metadaten aktualisieren: Sie können Metadaten von PDF-Dokumenten auch mit pypdf aktualisieren.
GitHub

GitHub-Statistiken

Name:
Sprache:
Sterne:
Gabeln:
Lizenz:
Das Repository wurde zuletzt aktualisiert unter

Erste Schritte mit pypdf

Sie benötigen Python Version 3.6.0 oder höher, um pypdf zu installieren und zu verwenden. Installieren Sie also zuerst Python und verwenden Sie dann die folgenden Befehle, um pypdf mit pip und virtuelle Umgebung.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

Mac OS


python -m venv venv
source venv/bin/activate
pip install pypdf

Windows


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Metadaten von PDF lesen

Wir können die Metadaten eines PDF-Dokuments mithilfe der pypdf-Bibliothek lesen. Wir erhalten die Metadaten einer PDF-Datei aus der Eigenschaft metadata der Klasse PdfReader in der pypdf-Bibliothek. Weitere Informationen finden Sie im folgenden Codeausschnitt:

Ausgabe

Der folgende Screenshot zeigt die Metadaten der bereitgestellten PDF-Datei:

Aktualisieren der Metadaten von PDF

Mit der pypdf-Bibliothek können wir auch Metadaten eines PDF-Dokuments wie Autor, Produzent, Betreff und Titel usw. aktualisieren. Wir übergeben ein Objekt, das die Metadateninformationen enthält, an die Methode add_metadata der Klasse PdfWriter in der pypdf-Bibliothek, um Metadaten des PDF-Dokuments zu aktualisieren/schreiben. Weitere Informationen finden Sie im folgenden Codeausschnitt:

Abschluss

Zusammenfassend erweist sich pypdf als außergewöhnliche Python-Bibliothek zum Lesen und Aktualisieren von Metadaten von PDF-Dokumenten. Entwickler können Metadaten von PDF-Dokumenten problemlos lesen und aktualisieren.

Ähnliche Produkte

 Deutsch