Βιβλιοθήκη μεταδεδομένων Python ανοιχτού κώδικα
Δωρεάν και ανοιχτού κώδικα βιβλιοθήκη Python για ανάγνωση, επεξεργασία και ενημέρωση μεταδεδομένων εγγράφων.
Τι είναι το pyExifTool;
Η βιβλιοθήκη Python pyExifTool είναι ένα ελαφρύ περιτύλιγμα γύρω από το δημοφιλές βοηθητικό πρόγραμμα ExifTool, που επιτρέπει στους χρήστες να αλληλεπιδρούν με τα μεταδεδομένα του αρχείου μέσω προγραμματισμού. Με υποστήριξη για διάφορες μορφές αρχείων, συμπεριλαμβανομένων αρχείων PDF, εικόνων, βίντεο και αρχείων ήχου, το pyexiftool παρέχει τη δυνατότητα ανάγνωσης, εγγραφής και διαγραφής μεταδεδομένων χρησιμοποιώντας τις ισχυρές δυνατότητες του ExifTool. Η βιβλιοθήκη έχει σχεδιαστεί για να αξιοποιεί τις δυνατότητες της γραμμής εντολών του ExifTool ενώ προσφέρει μια διεπαφή Pythonic για ευκολία στη χρήση. Σε αυτή τη σελίδα, θα συζητήσουμε πώς οι προγραμματιστές μπορούν να χρησιμοποιήσουν το pyExifTool API στις εφαρμογές Python τους για να εργαστούν με μεταδεδομένα αρχείων.
Ξεκινώντας με το pyExifTool
Για να έχετε το pyExifTool, πρέπει να εγκαταστήσετε την έκδοση Python 3.6+ και το ExifTool στο σύστημά σας. Επομένως, πρώτα εγκαταστήστε το Python και, στη συνέχεια, χρησιμοποιήστε τις παρακάτω εντολές για να εγκαταστήσετε το pyExifTool στον υπολογιστή σας χρησιμοποιώντας το pip και εικονικό περιβάλλον.
python -m pip install -U pyexiftool
1. Checkout the source code from Github repository git clone git://github.com/sylikc/pyexiftool.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Ανάγνωση μεταδεδομένων PDF και άλλων αρχείων
Το pyExifTool σάς παρέχει υποστήριξη για την ανάγνωση μεταδεδομένων μιας ποικιλίας μορφών αρχείων όπως PDF, BMP, JPEG, DOCX, XLSX και πολλών άλλων. Το API σάς επιτρέπει να διαβάζετε τις πληροφορίες μεταδεδομένων ενός αρχείου χρησιμοποιώντας τη μέθοδο get_metadata. Ελέγξτε το παρακάτω απόσπασμα κώδικα όπου διαβάζουμε τις πληροφορίες μεταδεδομένων από ένα αρχείο PDF.
Παραγωγή
Το παρακάτω στιγμιότυπο οθόνης εμφανίζει τα μεταδεδομένα του αρχείου PDF:
Ενημέρωση μεταδεδομένων PDF και άλλων μορφών αρχείων
Μπορείτε επίσης να ενημερώσετε τα μεταδεδομένα ενός PDF ή οποιουδήποτε άλλου εγγράφου χρησιμοποιώντας το pyExifTool. Το εργαλείο σάς επιτρέπει να ενημερώσετε τα πεδία μεταδεδομένων όπως συγγραφέας, παραγωγός, θέμα, τίτλος κ.λπ., ορίζοντας τις ετικέτες. Αυτό είναι όπως φαίνεται στο ακόλουθο δείγμα κώδικα.
Σύναψη
Συμπερασματικά, το pyExifTool Python είναι μια ισχυρή βιβλιοθήκη Python για την ανάγνωση και την ενημέρωση των μεταδεδομένων διαφορετικών τύπων εγγράφων. Βασίζεται στο ExifTool που υποστηρίζει πολλαπλές μορφές αρχείων για ανάγνωση/εγγραφή μεταδεδομένων. Οι προγραμματιστές εφαρμογών Python μπορούν να το χρησιμοποιήσουν για να αναπτύξουν προγράμματα που μπορούν να διαβάζουν και να γράφουν τα μεταδεδομένα ενός εγγράφου με απλά βήματα.