Βιβλιοθήκη μεταδεδομένων PDF Python ανοιχτού κώδικα
Δωρεάν και ανοιχτού κώδικα βιβλιοθήκη Python για ανάγνωση και ενημέρωση μεταδεδομένων εγγράφων PDF.
Τι είναι το pypdf;
Το Pypdf είναι μια ευέλικτη βιβλιοθήκη ανοιχτού κώδικα python γνωστή για το ποικίλο σύνολο δυνατοτήτων για χειρισμό PDF. Αυτή η βιβλιοθήκη είναι χρήσιμη για διάφορους χειρισμούς PDF, όπως ανάλυση PDF και διαίρεση και συγχώνευση PDF κ.λπ., αλλά σε αυτήν την κριτική προϊόντος, θα εστιάσουμε μόνο στις δυνατότητες διαχείρισης μεταδεδομένων PDF.
Ακολουθούν τα κύρια χαρακτηριστικά του pypdf που σχετίζονται με τα μεταδεδομένα:
- Ανάγνωση μεταδεδομένων PDF: Μπορείτε να διαβάσετε ιδιότητες (όπως συγγραφέας, δημιουργός, παραγωγός, τίτλος, θέμα και λέξεις-κλειδιά) εγγράφων PDF χρησιμοποιώντας pypdf.
- Ενημέρωση μεταδεδομένων PDF: Μπορείτε επίσης να ενημερώσετε τα μεταδεδομένα των εγγράφων PDF χρησιμοποιώντας το pypdf.
Ξεκινώντας με το pypdf
Χρειάζεστε Python έκδοση 3.6.0 ή νεότερη για να εγκαταστήσετε και να χρησιμοποιήσετε το pypdf. Επομένως, πρώτα εγκαταστήστε το Python και μετά χρησιμοποιήστε τις παρακάτω εντολές για να εγκαταστήσετε το pypdf στον υπολογιστή σας χρησιμοποιώντας pip και εικονικό περιβάλλον.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Ανάγνωση μεταδεδομένων PDF
Μπορούμε να διαβάσουμε τα μεταδεδομένα ενός εγγράφου PDF χρησιμοποιώντας τη βιβλιοθήκη pypdf. Θα λάβουμε τα μεταδεδομένα ενός PDF από την ιδιότητα metadata της κλάσης PdfReader στη βιβλιοθήκη pypdf. Ελέγξτε το παρακάτω απόσπασμα κώδικα για λεπτομέρειες:
Παραγωγή
Το παρακάτω στιγμιότυπο οθόνης εμφανίζει τα μεταδεδομένα του παρεχόμενου αρχείου PDF:
Ενημέρωση μεταδεδομένων PDF
Μπορούμε επίσης να ενημερώσουμε τα μεταδεδομένα ενός εγγράφου PDF, όπως συγγραφέα, παραγωγό, θέμα και τίτλο κ.λπ. χρησιμοποιώντας τη βιβλιοθήκη pypdf. Θα περάσουμε ένα αντικείμενο που περιέχει τις πληροφορίες μεταδεδομένων στη μέθοδο add_metadata της κλάσης PdfWriter στη βιβλιοθήκη pypdf για ενημέρωση/εγγραφή μεταδεδομένων του εγγράφου PDF. Για λεπτομέρειες, ελέγξτε το παρακάτω απόσπασμα κώδικα:
συμπέρασμα
Συμπερασματικά, το pypdf αποδεικνύεται μια εξαιρετική βιβλιοθήκη Python για την ανάγνωση και την ενημέρωση μεταδεδομένων εγγράφων PDF. Οι προγραμματιστές μπορούν εύκολα να διαβάσουν και να ενημερώσουν τα μεταδεδομένα των εγγράφων PDF χωρίς προβλήματα.