Open Source Python-Metadatenbibliothek
Kostenlose und Open-Source-Python-Bibliothek zum Lesen, Bearbeiten und Aktualisieren von Metadaten von Dokumenten.
Was ist die Hachoir-Metadaten-API für Python?
hachoir-metadata ist eine Python-Bibliothek, die Teil des umfassenderen Hachoir-Projekts ist und zum Parsen und Extrahieren von Metadaten aus einer Vielzahl von Dateitypen entwickelt wurde. Sie bietet Tools zum Lesen von Metadaten, ohne dass die Dateien dekomprimiert oder vollständig dekodiert werden müssen, was sie leicht und effizient für grundlegende Metadatenprüfungsaufgaben macht.
Funktionen der Hachoir-Metadata-API
hachoir-metadata is a powerful API that has rich features as follow:- Dateityp-Unterstützung: Funktioniert mit vielen Dateiformaten, einschließlich Bildern, Videos, Audiodateien, Archiven und Dokumenten.
- Metadatenextraktion: Extrahiert grundlegende Metadaten wie Dateigröße, Erstellungsdatum, Änderungsdatum und weitere formatspezifische Eigenschaften (z. B. EXIF für Bilder, Codecs für Videos usw.).
- Nur-Lese-Vorgänge: Konzentriert sich auf das Lesen und Überprüfen von Metadaten, ohne die Originaldatei zu ändern.
- Dateityp-agnostisch: Erkennt Dateitypen automatisch und extrahiert Metadaten entsprechend.
- Integration: Kann in Python-Anwendungen zur Verwendung in Arbeitsabläufen wie Inhaltsorganisation, digitaler Forensik und Archivierungssystemen integriert werden.
Modi der Hachoir-Metadata-API
- klassischer Modus: Metadaten extrahieren, Sie können –level=LEVEL verwenden, um die anzuzeigende (und nicht zu extrahierende) Informationsmenge zu begrenzen.
- type: zeigt in einer Zeile das Dateiformat und die wichtigsten Informationen an
- mime: nur den MIME-Typ der Datei anzeigen
Erste Schritte mit der Hachoir API für Python
Um die Hachoir-API für Python zu verwenden, müssen Sie Python Version 3.6+ und Hachoir auf Ihrem System installieren. Installieren Sie also zuerst Python und verwenden Sie dann die folgenden Befehle, um die Hachoir-API auf Ihrem Computer mit pip und virtueller Umgebung zu installieren.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Arbeiten mit der hachoir-metadata-API für Python – Beispiele
Mit der hachoir-metadata API für Python können Sie die Metadateninformationen aus Mediendateitypen lesen. Mit nur wenigen Codezeilen können Sie leistungsstarke Anwendungen entwickeln, die Metadateninformationen aus verschiedenen Dateiformaten lesen können. Die folgenden Codebeispiele zeigen, wie die hachoir-metadata API in Python-Anwendungen verwendet werden kann.
Arbeiten mit der hachoir-metadata-API für Python – Beispiele
pyExifTool unterstützt Sie beim Lesen von Metadaten aus einer Vielzahl von Dateiformaten wie PDF, BMP, JPEG, DOCX, XLSX und vielen anderen. Mit der API können Sie die Metadateninformationen einer Datei mithilfe der Methode get_metadata lesen. Sehen Sie sich den folgenden Codeausschnitt an, in dem wir die Metadateninformationen aus einer PDF-Datei lesen.
Ausgabe
Wenn Sie diesen Code ausführen, ähnelt die Ausgabe etwa der folgenden (abhängig von den in Ihrer Beispieldatei verfügbaren Informationen):
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
Abschluss
Die API von hachoir-metadata bietet eine leistungsstarke und dennoch leichte Lösung zum Extrahieren von Metadaten aus einer Vielzahl von Dateiformaten und ist damit ein hervorragendes Tool für Python-Entwickler, die in Bereichen wie digitale Forensik, Inhaltsverwaltung und Datenanalyse arbeiten. Die Fähigkeit, Dateien ohne Änderungen zu analysieren, gewährleistet die Datenintegrität, während die Python-Schnittstelle die Integration in Anwendungen und Arbeitsabläufe vereinfacht. Mit der Unterstützung verschiedener Dateitypen und Metadateneigenschaften ist hachoir-metadata eine vielseitige Wahl für eine schnelle und effiziente Metadatenprüfung sowohl für persönliche als auch für professionelle Projekte/Systeme.