Open Source Python-Metadatenbibliothek für PDF-Dokumente
Kostenlose und Open-Source-Python-Bibliothek zum Lesen, Bearbeiten und Aktualisieren von Metadaten von PDF-Dateien.
Was ist PikePDF für Python?
PikePDF ist eine moderne Python-Bibliothek, die auf die nahtlose PDF-Bearbeitung zugeschnitten ist und leistungsstarke Funktionen speziell für die Arbeit mit Metadaten bietet. PikePDF basiert auf der robusten QPDF-Bibliothek und ermöglicht Entwicklern das einfache Hinzufügen, Bearbeiten und Entfernen von Metadaten aus PDF-Dateien. Damit ist es ein unverzichtbares Tool zum Organisieren und Anreichern von Dokumentinformationen. Egal, ob Sie Titel, Autoren, Themenfelder oder benutzerdefinierte Metadateneinträge aktualisieren müssen, PikePDF bietet eine pythonische und intuitive API zum programmgesteuerten Verwalten dieser Details. Es unterstützt auch die Verarbeitung eingebetteter Metadaten für eine verbesserte Dokumentklassifizierung und -durchsuchbarkeit und gewährleistet die Einhaltung von Workflows, die stark auf detaillierte Dokumentbeschreibungen angewiesen sind. Mit seinem Fokus auf Zuverlässigkeit und Leistung ist PikePDF ideal für die Automatisierung von Metadatenverwaltungsaufgaben in Dokumentverarbeitungssystemen oder zur Verbesserung metadatengesteuerter PDF-Workflows.
Funktionen der PikePDF API
PikePDF API for Python has rich set of features for working with the metadata of the PDF documents. Some of its features are as listed below.- PDF-Manipulation: Seiten in PDF-Dateien zusammenführen, aufteilen, drehen und neu anordnen.
- Metadatenverwaltung: Fügen Sie Metadaten hinzu, bearbeiten oder entfernen Sie sie, um die PDF-Organisation und -Informationen zu verbessern.
- Verschlüsselung und Sicherheit: Verschlüsseln Sie PDFs mit Passwörtern, entsperren Sie geschützte PDFs und verwalten Sie Sicherheitseinstellungen.
- Beschädigte Dateien reparieren: Erkennen und beheben Sie Probleme in beschädigten oder fehlerhaften PDF-Dokumenten.
- PDF/A-Konvertierung: Konvertieren Sie PDFs zur langfristigen Archivierung und Konformität in das PDF/A-Format.
- Unterstützung eingebetteter Schriftarten: Verwalten Sie eingebettete Schriftarten für Textkonsistenz und Kompatibilität.
- Leistungsorientiert: Optimiert für schnelle und zuverlässige Vorgänge mit großen oder komplexen PDFs.
- Basierend auf QPDF: Nutzt die leistungsstarke QPDF-Bibliothek für erweiterte PDF-Bearbeitungsfunktionen.
- Open Source: Kostenlos nutzbar und aktiv gepflegt von der Entwickler-Community.
Vorteile der Verwendung der PikePDF-API
- Metadatenverwaltung: Einfaches Hinzufügen, Bearbeiten oder Entfernen von Metadaten zur Verbesserung der PDF-Organisation und Durchsuchbarkeit.
- PDF/A-Unterstützung: Konvertieren Sie PDFs in Archivformate, während Sie die Metadaten beibehalten oder aktualisieren.
- Beschädigungsbehandlung: Reparieren und stellen Sie beschädigte PDF-Dateien wieder her, ohne Metadaten zu verlieren.
- Verschlüsselung und Sicherheit: Verwalten Sie Kennwortschutz und Verschlüsselung, während Sie die Integrität der Metadaten wahren.
- Benutzerdefinierte Metadaten: Fügen Sie benutzerdefinierte Felder hinzu, um PDF-Metadaten an bestimmte Arbeitsabläufe oder Geschäftsanforderungen anzupassen.
- Hohe Leistung: Optimiert für die schnelle und effiziente Verarbeitung großer und komplexer PDF-Dateien.
- Open Source: Kostenlos und aktiv gepflegt, bietet eine zuverlässige und kostengünstige Lösung.
- Basierend auf QPDF: Nutzt die leistungsstarken Funktionen von QPDF für erweiterte PDF- und Metadatenvorgänge.
Erste Schritte mit der PikePDF API für Python
Um PikePDF in Ihren Python-Anwendungen verwenden zu können, müssen Sie Python Version 3.9+ auf Ihrem System installieren. Installieren Sie also zuerst Python und verwenden Sie dann die folgenden Befehle, um Hachoir API auf Ihrem Computer mit pip und virtueller Umgebung zu installieren.
pip install pikepdf
Arbeiten mit der PikePDF API für Python – Beispiele
Sie können PikePDF zum Lesen, Schreiben und Aktualisieren von Metadateninformationen von PDF-Dateien verwenden. Die API bietet einfach zu verwendende Methoden und Beispiele für die Arbeit mit PDF-Dateien aus Ihren Python-Anwendungen heraus.
Lesen Sie die Metadateninformationen einer Datei mit der PikePDF-API für Python
Das Lesen von Metadateninformationen aus PDF-Dateien mit PikePDF ist einfach. Sie können den folgenden Beispielcode verwenden, um die Metadateninformationen aus jedem PDF-Dokument zu lesen.
Ausgabe
Wenn Sie diesen Code ausführen, sieht die Ausgabe ungefähr wie folgt aus:
PDF Metadata:
/Title: Sample PDF Document
/Author: John Doe
/Subject: Example Usage
/Producer: Adobe PDF Library
/CreationDate: D:20241226093000Z
Wenn in der Datei keine Metadateninformationen verfügbar sind, ist die Ausgabe leer.
Schreiben Sie Metadateninformationen in eine PDF-Datei mithilfe der PikePDF-API für Python
PikePDF kann Metadaten einer PDF-Datei schreiben oder aktualisieren. Die Bibliothek ermöglicht es Ihnen, vorhandene Metadatenfelder zu ändern oder neue hinzuzufügen. Hier ist ein Beispiel, das zeigt, wie Metadaten in einer PDF-Datei aktualisiert werden:
Hier sind einige allgemeine Standardfelder, die Sie aktualisieren können:
Title: The title of the document.
Author: The author of the document.
Subject: The subject or topic of the document.
Keywords: Keywords associated with the document for search purposes.
Creator: The application that created the document.
Producer: The software that generated the PDF.
CreationDate: The date the document was created.
ModDate: The date the document was last modified.