Βιβλιοθήκη μεταδεδομένων PDF Python ανοιχτού κώδικα
Δωρεάν και ανοιχτού κώδικα βιβλιοθήκη Python για ανάγνωση και ενημέρωση μεταδεδομένων εγγράφων PDF.
Τι είναι το pypdf;
Το Pypdf είναι μια ευέλικτη βιβλιοθήκη ανοιχτού κώδικα python γνωστή για το ποικίλο σύνολο δυνατοτήτων για χειρισμό PDF. Αυτή η βιβλιοθήκη είναι χρήσιμη για διάφορους χειρισμούς PDF, όπως ανάλυση PDF και διαίρεση και συγχώνευση PDF κ.λπ., αλλά σε αυτήν την κριτική προϊόντος, θα επικεντρωθούμε μόνο στις δυνατότητες διαχείρισης μεταδεδομένων PDF.
Ακολουθούν τα κύρια χαρακτηριστικά του pypdf που σχετίζονται με τα μεταδεδομένα:
- Ανάγνωση μεταδεδομένων PDF: Μπορείτε να διαβάσετε ιδιότητες (όπως συγγραφέας, δημιουργός, παραγωγός, τίτλος, θέμα και λέξεις-κλειδιά) εγγράφων PDF χρησιμοποιώντας pypdf.
- Ενημέρωση μεταδεδομένων PDF: Μπορείτε επίσης να ενημερώσετε τα μεταδεδομένα των εγγράφων PDF χρησιμοποιώντας το pypdf.
Ξεκινώντας με το pypdf
Χρειάζεστε Python έκδοση 3.6.0 ή νεότερη για να εγκαταστήσετε και να χρησιμοποιήσετε το pypdf. Επομένως, πρώτα εγκαταστήστε το Python και, στη συνέχεια, χρησιμοποιήστε τις παρακάτω εντολές για να εγκαταστήσετε το pypdf στον υπολογιστή σας χρησιμοποιώντας pip και εικονικό περιβάλλον.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Ανάγνωση μεταδεδομένων PDF
Μπορούμε να διαβάσουμε τα μεταδεδομένα ενός εγγράφου PDF χρησιμοποιώντας τη βιβλιοθήκη pypdf. Θα λάβουμε τα μεταδεδομένα ενός PDF από την ιδιότητα metadata της κλάσης PdfReader στη βιβλιοθήκη pypdf. Ελέγξτε το παρακάτω απόσπασμα κώδικα για λεπτομέρειες:
Παραγωγή
Το παρακάτω στιγμιότυπο οθόνης εμφανίζει τα μεταδεδομένα του παρεχόμενου αρχείου PDF:
Ενημέρωση μεταδεδομένων του PDF
Μπορούμε επίσης να ενημερώσουμε τα μεταδεδομένα ενός εγγράφου PDF, όπως συγγραφέα, παραγωγό, θέμα και τίτλο κ.λπ. χρησιμοποιώντας τη βιβλιοθήκη pypdf. Θα περάσουμε ένα αντικείμενο που περιέχει τις πληροφορίες μεταδεδομένων στη μέθοδο add_metadata της κλάσης PdfWriter στη βιβλιοθήκη pypdf για ενημέρωση/εγγραφή μεταδεδομένων του εγγράφου PDF. Για λεπτομέρειες, ελέγξτε το παρακάτω απόσπασμα κώδικα:
Σύναψη
Συμπερασματικά, το pypdf αποδεικνύεται μια εξαιρετική βιβλιοθήκη Python για την ανάγνωση και την ενημέρωση μεταδεδομένων εγγράφων PDF. Οι προγραμματιστές μπορούν εύκολα να διαβάσουν και να ενημερώσουν τα μεταδεδομένα των εγγράφων PDF χωρίς προβλήματα.
Παρόμοια Προϊόντα
- hachoir | Βιβλιοθήκη Python ανοιχτού κώδικα για μεταδεδομένα εγγράφων
- Mutagen Python Library - Διαχείριση μεταδεδομένων ήχου χωρίς κόπο
- OpenPyXL API - Διαχείριση μεταδεδομένων του Excel χωρίς κόπο
- pdf-lib για JavaScript | Διαχειριστείτε εύκολα τα μεταδεδομένα PDF
- PikePDF Python Library - Εύκολη διαχείριση PDF και ασφάλεια