Avoimen lähdekoodin Python PDF Annotation Library
Kokeile tätä ilmaista ja avoimen lähdekoodin Python-kirjastoa merkintöjen lisäämiseen ja poimimiseen PDF-dokumenteista.
Mikä on pypdf?
Pypdf on ilmainen ja avoimen lähdekoodin python-kirjasto, joka tunnetaan monipuolisista ominaisuuksistaan PDF-dokumenttien käsittelyyn python-ympäristössä. Tämä työkalu on kätevä erilaisissa PDF-käsittelyissä, mutta keskitymme tässä katsauksessa sen huomautuksiin liittyviin ominaisuuksiin.
Huomattavia huomautuksiin liittyviä pypdf-ominaisuuksia ovat:
- Muotomerkintöjen lisääminen: Voimme piirtää muotoja, kuten viivoja, suorakulmioita, ellipsejä ja polygoneja jne. PDF-sivujen tietyille alueille huomautuksina.
- Tekstimerkintöjen lisääminen: Voimme lisätä tekstimerkintöjä PDF-sivujen tiettyihin paikkoihin.
- Linkkimerkintöjen lisääminen: PDF-dokumentteihin on mahdollista lisätä myös linkkimerkintöjä (kuten hyperlinkkejä).
- Merkintöjen purkaminen: Voimme iteroida ja poimia tietoja kaikista PDF-dokumentin merkinnöistä käyttämällä pypdf-kirjastoa.
pypdf:n käytön aloittaminen
Tarvitset Python-version 3.6.0 tai uudemman pypdf:n asentamiseen ja käyttämiseen. Joten asenna ensin Python ja asenna sitten pypdf koneellesi alla olevien komentojen avulla käyttämällä pip ja virtuaaliympäristö a>.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
Mac käyttöjärjestelmä
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Lisää suorakulmiomerkintä PDF-tiedostoon
Voimme lisätä suorakaiteen muotoisia huomautuksia PDF-dokumentteihin pypdf-kirjaston avulla. Käytämme pypdf-kirjaston pypdf.annotations-moduulin Rectangle-luokkaa suorakulmion määrittämiseen. Sitten käytämme PDFWriter-luokan add_annotations-menetelmää suorakaiteen muotoisen huomautuksen lisäämiseen PDF-tiedostoon.
Katso tarkemmat tiedot alla olevasta koodinpätkästä:
Alla olevassa kuvakaappauksessa voit nähdä, että suorakaide on lisätty Avoimen lähdekoodin-sanan merkintään:
Lisää tekstihuomautus PDF-tiedostoon
Luomme tekstimerkintöjä käyttämällä Teksti-luokkaa pypdf-kirjaston pypdf.annotations-moduulista. Tämän jälkeen voimme käyttää PDFWriter-luokan add_annotations-menetelmää pypdf-kirjastosta huomautuksen lisäämiseen PDF-tiedostoon. Tekstihuomautus lisätään kuvakkeena, joka laajenee ja näyttää tekstin, kun kuvaketta napsautetaan. Katso tarkemmat tiedot alla olevasta koodinpätkästä:
Kuten alla olevasta kuvasarjasta nähdään, yllä oleva koodi lisää PDF-tiedostoon kuvakkeen määritettyyn kohtaan, joka näyttää tekstimerkinnän, kun kuvaketta napsautetaan:
Lisää linkkimerkintä PDF-tiedostoon
Linkkimerkinnät luodaan Link-luokan avulla pypdf.annotations-moduulista. Linkin huomautuksen ongelma on kuitenkin se, että se vain lisää linkin, mutta se ei näy. Tämän ongelman ratkaisemiseksi sisällytämme suorakulmion käyttämällä Rectangle-luokkaa pypdf.annotations-moduulista, kuten selitimme aiemmin. Tällä tavalla käyttäjä voi visuaalisesti tunnistaa paikan, johon linkkimerkintä lisätään. Tarkista alla oleva koodinpätkä ymmärtääksesi paremmin:
Kuten tuloksesta näemme, suorakulmio toimii alueena, joka napsautettaessa ohjaa käyttäjän määritettyyn linkkiin.
Pura huomautukset PDF-tiedostosta
Voimme poimia huomautuksia PDF-tiedostosta pypdf-kirjaston avulla. Toistamme kaikki merkinnät PDF-sivuilla ja käytämme sitten get_object-menetelmää merkintäobjektin hakemiseen. Sitten poimimme asiaankuuluvat tiedot objektista. Katso tarkemmat tiedot alla olevasta koodinpätkästä:
Kuten alla olevasta kuvakaappauksesta näemme, ohjelma on palauttanut merkintätyypin ja merkintöjen koordinaatit PDF-dokumenttiin:
Johtopäätös
Pypdf antaa Python-kehittäjille mahdollisuuden lisätä erityyppisiä huomautuksia PDF-tiedostoihin ja päästä käsiksi olennaisiin tietoihin huomautuksista, kuten niiden tyypistä ja sijainnista, mikä tekee siitä käytännöllisen valinnan tehtäviin, jotka vaativat huomautusten lisäämistä ja tietojen poimia huomautuksista.