Βιβλιοθήκη μεταδεδομένων Python ανοιχτού κώδικα

Δωρεάν και ανοιχτού κώδικα βιβλιοθήκη Python για ανάγνωση, επεξεργασία και ενημέρωση μεταδεδομένων εγγράφων.

Τι είναι το Hachoir-metadata API για Python;

Το hachoir-metadata είναι μια βιβλιοθήκη Python που αποτελεί μέρος του ευρύτερου έργου Hachoir, σχεδιασμένη για ανάλυση και εξαγωγή μεταδεδομένων από μεγάλη ποικιλία αρχείων τύπους. Παρέχει εργαλεία για την ανάγνωση μεταδεδομένων χωρίς να χρειάζεται να αποσυμπιεστούν ή να αποκωδικοποιηθούν πλήρως τα αρχεία, καθιστώντας το ελαφρύ και αποτελεσματικό για βασικές εργασίες επιθεώρησης μεταδεδομένων.

Χαρακτηριστικά του hachoir-metadata API

hachoir-metadata is a powerful API that has rich features as follow:
  • Υποστήριξη τύπου αρχείου: Λειτουργεί με πολλές μορφές αρχείων, συμπεριλαμβανομένων εικόνων, βίντεο, αρχείων ήχου, αρχείων και εγγράφων.
  • Εξαγωγή μεταδεδομένων: Εξάγει βασικά μεταδεδομένα, όπως το μέγεθος αρχείου, την ημερομηνία δημιουργίας, την ημερομηνία τροποποίησης και περισσότερες ιδιότητες συγκεκριμένης μορφής (π.χ. EXIF για εικόνες, κωδικοποιητές για βίντεο κ.λπ.).
  • Λειτουργίες μόνο για ανάγνωση: Εστιάζει στην ανάγνωση και την επιθεώρηση μεταδεδομένων χωρίς τροποποίηση του αρχικού αρχείου.
  • Αγνωστικός τύπος αρχείου: Εντοπίζει αυτόματα τύπους αρχείων και εξάγει τα μεταδεδομένα ανάλογα.
  • Ενσωμάτωση: Μπορεί να ενσωματωθεί σε εφαρμογές Python για χρήση σε ροές εργασίας όπως η οργάνωση περιεχομένου, η ψηφιακή εγκληματολογία και τα συστήματα αρχειοθέτησης.

Modes of hachoir-metadata API

  • κλασική λειτουργία: εξαγωγή μεταδεδομένων, μπορείτε να χρησιμοποιήσετε –level=LEVEL για να περιορίσετε την ποσότητα των πληροφοριών προς εμφάνιση (και όχι για εξαγωγή)
  • type: εμφανίζει σε μία γραμμή τη μορφή αρχείου και τις πιο σημαντικές πληροφορίες
  • mime: απλώς εμφανίστε τον τύπο αρχείου MIME

Ξεκινώντας με το Hachoir API για Python

GitHub

Στατιστικά GitHub

Ονομα:
Γλώσσα:
Αστέρια:
Πιρούνια:
Αδεια:
Το αποθετήριο ενημερώθηκε τελευταία φορά στις

Για να χρησιμοποιήσετε το Hachoir API για Python, πρέπει να εγκαταστήσετε την έκδοση Python 3.6+ και το Hachoir στο σύστημά σας. Επομένως, πρώτα εγκαταστήστε το Python και, στη συνέχεια, χρησιμοποιήστε τις παρακάτω εντολές για να εγκαταστήσετε το Hachoir API στον υπολογιστή σας χρησιμοποιώντας το pip και εικονικό περιβάλλον.


pip install hachoir

Alternatively, you can also install hachoir from Github repository using the following steps:


1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]

Εργασία με hachoir-metadata API για Python - Παραδείγματα

Το hachoir-metadata API για Python σάς επιτρέπει να διαβάζετε τις πληροφορίες μεταδεδομένων από τύπους αρχείων πολυμέσων. Με λίγες μόνο γραμμές κώδικα, μπορείτε να αναπτύξετε ισχυρές εφαρμογές που μπορούν να διαβάσουν πληροφορίες μεταδεδομένων από διαφορετικές μορφές αρχείων. Τα ακόλουθα δείγματα κώδικα δείχνουν πώς το hachoir-metadata API μπορεί να χρησιμοποιηθεί σε εφαρμογές Python.

Εργασία με hachoir-metadata API για Python - Παραδείγματα

Το pyExifTool σάς παρέχει υποστήριξη για την ανάγνωση μεταδεδομένων μιας ποικιλίας μορφών αρχείων όπως PDF, BMP, JPEG, DOCX, XLSX και πολλών άλλων. Το API σάς επιτρέπει να διαβάζετε τις πληροφορίες μεταδεδομένων ενός αρχείου χρησιμοποιώντας τη μέθοδο get_metadata. Ελέγξτε το παρακάτω απόσπασμα κώδικα όπου διαβάζουμε τις πληροφορίες μεταδεδομένων από ένα αρχείο PDF.

Παραγωγή

Όταν εκτελείτε αυτόν τον κώδικα, η έξοδος θα είναι κάπως παρόμοια με την παρακάτω (ανάλογα με τις πληροφορίες που είναι διαθέσιμες στο δείγμα αρχείου σας:


Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian

Σύναψη

Το hachoir-metadata API προσφέρει μια ισχυρή αλλά ελαφριά λύση για την εξαγωγή μεταδεδομένων από μια μεγάλη ποικιλία μορφών αρχείων, καθιστώντας το ένα εξαιρετικό εργαλείο για προγραμματιστές python που εργάζονται σε τομείς όπως η ψηφιακή εγκληματολογία, η διαχείριση περιεχομένου και η ανάλυση δεδομένων. Η ικανότητά του να αναλύει αρχεία χωρίς τροποποίηση διασφαλίζει την ακεραιότητα των δεδομένων, ενώ η διεπαφή Pythonic απλοποιεί την ενσωμάτωση σε εφαρμογές και ροές εργασίας. Με υποστήριξη διαφορετικών τύπων αρχείων και ιδιοτήτων μεταδεδομένων, το hachoir-metadata είναι μια ευέλικτη επιλογή για γρήγορη και αποτελεσματική επιθεώρηση μεταδεδομένων τόσο για προσωπικά όσο και για επαγγελματικά έργα/συστήματα.

Παρόμοια Προϊόντα

 Ελληνικά