Open Source Python PDF-Metadatenbibliothek

Kostenlose und Open-Source-Python-Bibliothek zum Lesen und Aktualisieren der Metadaten von PDF-Dokumenten.

Was ist pypdf?

Pypdf ist eine vielseitige Open-Source-Python-Bibliothek, die für ihre vielfältigen Funktionen zur PDF-Bearbeitung bekannt ist. Diese Bibliothek ist für verschiedene PDF-Bearbeitungen wie PDF-Parsing und PDF-Aufteilen und Zusammenführen usw. praktisch. In dieser Produktbewertung konzentrieren wir uns jedoch nur auf die Funktionen zur Verwaltung von PDF-Metadaten.

Im Folgenden sind die Hauptfunktionen von pypdf in Bezug auf Metadaten aufgeführt:

  • PDF-Metadaten lesen: Sie können Eigenschaften (wie Autor, Ersteller, Produzent, Titel, Betreff und Schlüsselwörter) von PDF-Dokumenten mit pypdf lesen.
  • PDF-Metadaten aktualisieren: Sie können Metadaten von PDF-Dokumenten auch mit pypdf aktualisieren.
GitHub

GitHub-Statistiken

Name:
Sprache:
Sterne:
Gabeln:
Lizenz:
Das Repository wurde zuletzt aktualisiert unter

Erste Schritte mit pypdf

Sie benötigen Python Version 3.6.0 oder höher, um pypdf zu installieren und zu verwenden. Installieren Sie also zuerst Python und verwenden Sie dann die folgenden Befehle, um pypdf auf Ihrem Computer mit pip und virtueller Umgebung zu installieren.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

MacOS


python -m venv venv
source venv/bin/activate
pip install pypdf

Windows


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Lesen von PDF-Metadaten

Wir können die Metadaten eines PDF-Dokuments mithilfe der pypdf-Bibliothek lesen. Wir erhalten die Metadaten eines PDFs aus der Eigenschaft metadata der Klasse PdfReader in der pypdf-Bibliothek. Weitere Einzelheiten finden Sie im folgenden Codeausschnitt:

Ausgabe

Der folgende Screenshot zeigt die Metadaten der bereitgestellten PDF-Datei:

Aktualisieren von PDF-Metadaten

Wir können auch Metadaten eines PDF-Dokuments wie Autor, Produzent, Thema und Titel usw. mithilfe der pypdf-Bibliothek aktualisieren. Wir übergeben ein Objekt mit den Metadateninformationen an die Methode add_metadata der Klasse PdfWriter in der pypdf-Bibliothek, um Metadaten des PDF-Dokuments zu aktualisieren/schreiben. Weitere Einzelheiten finden Sie im folgenden Codeausschnitt:

Abschluss

Zusammenfassend erweist sich pypdf als außergewöhnliche Python-Bibliothek zum Lesen und Aktualisieren von Metadaten von PDF-Dokumenten. Entwickler können Metadaten von PDF-Dokumenten problemlos lesen und aktualisieren.

Ähnliche Produkte

 Deutsch