Open Source Python PDF Annotation Library
Δοκιμάστε αυτήν τη δωρεάν και ανοιχτού κώδικα βιβλιοθήκη Python για προσθήκη και εξαγωγή σχολιασμών από έγγραφα PDF.
Τι είναι το pypdf;
Το Pypdf είναι μια δωρεάν και ανοιχτού κώδικα βιβλιοθήκη python γνωστή για το ποικίλο σύνολο δυνατοτήτων της για το χειρισμό εγγράφων PDF σε περιβάλλον python. Αυτό το εργαλείο είναι πρακτικό για διάφορους χειρισμούς PDF, αλλά θα επικεντρωθούμε στις λειτουργίες που σχετίζονται με τον σχολιασμό σε αυτήν την ανασκόπηση.
Τα αξιοσημείωτα χαρακτηριστικά του pypdf που σχετίζονται με τους σχολιασμούς περιλαμβάνουν:
- Προσθήκη σχολιασμών σχήματος: Μπορούμε να σχεδιάσουμε σχήματα όπως γραμμές, ορθογώνια, ελλείψεις και πολύγωνα κ.λπ. σε συγκεκριμένες περιοχές των σελίδων PDF ως σχολιασμούς.
- Προσθήκη σχολιασμών κειμένου: Μπορούμε να προσθέσουμε σχολιασμούς κειμένου σε συγκεκριμένες θέσεις σελίδων PDF.
- Προσθήκη σχολιασμών συνδέσμου: Μπορείτε επίσης να προσθέσετε σχολιασμούς συνδέσμων (όπως υπερσύνδεσμος) σε έγγραφα PDF.
- Εξαγωγή σχολιασμών: Μπορούμε να επαναλάβουμε και να εξαγάγουμε πληροφορίες σχετικά με όλους τους σχολιασμούς σε ένα έγγραφο PDF χρησιμοποιώντας τη βιβλιοθήκη pypdf.
Ξεκινώντας με το pypdf
Χρειάζεστε Python έκδοση 3.6.0 ή νεότερη για να εγκαταστήσετε και να χρησιμοποιήσετε το pypdf. Επομένως, πρώτα εγκαταστήστε το Python και μετά χρησιμοποιήστε τις παρακάτω εντολές για να εγκαταστήσετε το pypdf στον υπολογιστή σας χρησιμοποιώντας pip και εικονικό περιβάλλον.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Προσθήκη σχολιασμού ορθογωνίου σε PDF
Μπορούμε να προσθέσουμε ορθογώνιους σχολιασμούς σε έγγραφα PDF χρησιμοποιώντας τη βιβλιοθήκη pypdf. Θα χρησιμοποιήσουμε την κατηγορία Rectangle της ενότητας pypdf.annotations από τη βιβλιοθήκη pypdf για να ορίσουμε το ορθογώνιο. Στη συνέχεια, θα χρησιμοποιήσουμε τη μέθοδο add_annotations της τάξης PDFWriter για να προσθέσουμε ορθογώνιο σχολιασμό στο PDF.
Ελέγξτε το παρακάτω απόσπασμα κώδικα για λεπτομέρειες:
Παραγωγή
Στο παρακάτω στιγμιότυπο οθόνης, μπορείτε να δείτε ότι το ορθογώνιο προστίθεται για να σχολιάσει τη λέξη Ανοιχτού κώδικα:
Προσθήκη σχολιασμού κειμένου σε PDF
Δημιουργούμε σχολιασμούς κειμένου χρησιμοποιώντας την τάξη Κείμενο από την ενότητα pypdf.annotations της βιβλιοθήκης pypdf. Μετά από αυτό, μπορούμε να χρησιμοποιήσουμε τη μέθοδο add_annotations της τάξης PDFWriter από τη βιβλιοθήκη pypdf για να προσθέσουμε σχολιασμούς στο PDF. Ο σχολιασμός κειμένου προστίθεται ως εικονίδιο που επεκτείνεται και εμφανίζει το κείμενο όταν γίνεται κλικ στο εικονίδιο. Ελέγξτε το παρακάτω απόσπασμα κώδικα για λεπτομέρειες:
Παραγωγή
Όπως μπορούμε να δούμε στην παρακάτω εκπομπή οθόνης, ο παραπάνω κώδικας προσθέτει ένα εικονίδιο στο PDF σε καθορισμένη θέση που εμφανίζει σχολιασμό κειμένου όταν γίνεται κλικ στο εικονίδιο:
Προσθήκη σχολιασμού συνδέσμου σε PDF
Οι σχολιασμοί συνδέσμων δημιουργούνται χρησιμοποιώντας την κλάση Σύνδεσμος από την ενότητα pypdf.annotations. Ωστόσο, το πρόβλημα με τον σχολιασμό του συνδέσμου είναι ότι απλώς προσθέτει τον σύνδεσμο αλλά δεν είναι ορατός. Για να αντιμετωπίσουμε αυτό το ζήτημα, θα ενσωματώσουμε ένα ορθογώνιο χρησιμοποιώντας την κλάση Rectangle από την ενότητα pypdf.annotations όπως εξηγήσαμε νωρίτερα. Με αυτόν τον τρόπο, ο χρήστης μπορεί να προσδιορίσει οπτικά την τοποθεσία όπου προστίθεται ο σχολιασμός του συνδέσμου. Ελέγξτε το παρακάτω απόσπασμα κώδικα για καλύτερη κατανόηση:
Παραγωγή
Όπως μπορούμε να δούμε στην έξοδο, το ορθογώνιο χρησιμεύει ως περιοχή που, όταν πατηθεί, ανακατευθύνει τον χρήστη στον καθορισμένο σύνδεσμο.
Εξαγωγή σχολιασμών από PDF
Μπορούμε να εξαγάγουμε σχολιασμούς από ένα PDF χρησιμοποιώντας τη βιβλιοθήκη pypdf. Επαναλαμβάνουμε όλους τους σχολιασμούς σε σελίδες PDF και, στη συνέχεια, χρησιμοποιούμε τη μέθοδο get_object για να λάβουμε το αντικείμενο σχολιασμού. Στη συνέχεια εξάγουμε σχετικές πληροφορίες από το αντικείμενο. Ελέγξτε το παρακάτω απόσπασμα κώδικα για λεπτομέρειες:
Παραγωγή
Όπως μπορούμε να δούμε στο παρακάτω στιγμιότυπο οθόνης, το πρόγραμμα έχει επιστρέψει τον τύπο σχολιασμού και τις συντεταγμένες των σχολιασμών στο έγγραφο PDF:
συμπέρασμα
Το Pypdf εξουσιοδοτεί τους προγραμματιστές της Python να προσθέτουν διαφορετικούς τύπους σχολιασμών σε αρχεία PDF και να έχουν πρόσβαση σε βασικές πληροφορίες σχετικά με τους σχολιασμούς, όπως ο τύπος και η τοποθεσία τους, καθιστώντας το μια πρακτική επιλογή για εργασίες που απαιτούν προσθήκη σχολιασμών και εξαγωγή δεδομένων σχετικά με σχολιασμούς.