Atvirojo kodo Python PDF komentarų biblioteka
Išbandykite šią nemokamą ir atvirojo kodo Python biblioteką, kad pridėtumėte ir ištrauktumėte komentarus iš PDF dokumentų.
Kas yra pypdf?
Pypdf yra nemokama atvirojo kodo python biblioteka, žinoma dėl įvairių funkcijų, skirtų PDF dokumentams tvarkyti python aplinkoje. Šis įrankis yra naudingas atliekant įvairias PDF manipuliacijas, tačiau šioje apžvalgoje daugiausia dėmesio skirsime su anotacijomis susijusioms funkcijoms.
Svarbios pypdf funkcijos, susijusios su komentarais, yra šios:
- Formos komentarų pridėjimas: galime piešti tokias formas kaip linijos, stačiakampiai, elipsės, daugiakampiai ir tt konkrečiose PDF puslapių srityse kaip komentarus.
- Teksto komentarų pridėjimas: galime pridėti teksto komentarus konkrečiose PDF puslapių vietose.
- Nuorodų komentarų pridėjimas: prie PDF dokumentų taip pat galima pridėti nuorodų komentarus (pvz., hipersaitą).
- Komentarų ištraukimas: galime kartoti ir išgauti informaciją apie visus komentarus PDF dokumente naudodami pypdf biblioteką.
Darbo pradžia su pypdf
Norint įdiegti ir naudoti pypdf, reikia 3.6.0 ar naujesnės Python versijos. Taigi pirmiausia įdiekite Python, o tada naudokite toliau pateiktas komandas, kad įdiegtumėte pypdf savo kompiuteryje naudodami pip ir virtuali aplinka a>.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Pridėkite stačiakampį komentarą prie PDF
Naudodami pypdf biblioteką prie PDF dokumentų galime pridėti stačiakampių komentarų. Stačiakampiui apibrėžti naudosime pypdf.annotations modulio klasę Stačiakampis iš bibliotekos pypdf. Tada naudosime add_annotations klasės PDFWriter metodą, kad pridėtume stačiakampį komentarą prie PDF.
Norėdami gauti daugiau informacijos, patikrinkite toliau pateiktą kodo fragmentą:
Toliau esančioje ekrano kopijoje matote, kad stačiakampis pridėtas prie žodžio atvirojo kodo komentaro:
Pridėti teksto anotaciją į PDF
Kuriame teksto komentarus naudodami klasę Tekstas iš pypdf bibliotekos modulio pypdf.annotations. Po to galime naudoti PDFWriter klasės metodą add_annotations iš bibliotekos pypdf, kad pridėtume komentarą prie PDF. Teksto anotacija pridedama kaip piktograma, kuri išplečiama ir rodomas tekstas spustelėjus piktogramą. Norėdami gauti daugiau informacijos, patikrinkite toliau pateiktą kodo fragmentą:
Kaip matome toliau pateiktoje ekrano laidoje, aukščiau esantis kodas prideda prie PDF nurodytoje vietoje piktogramą, kuri rodo teksto anotaciją spustelėjus piktogramą:
Pridėkite nuorodos anotaciją į PDF
Nuorodų komentarai kuriami naudojant Nuoroda klasę iš modulio pypdf.annotations. Tačiau nuorodos anotacijos problema yra ta, kad ji tik prideda nuorodą, bet jos nematyti. Norėdami išspręsti šią problemą, įtrauksime stačiakampį naudodami Stačiakampio klasę iš modulio pypdf.annotations, kaip paaiškinome anksčiau. Tokiu būdu vartotojas gali vizualiai nustatyti vietą, kur pridedama nuorodos anotacija. Norėdami geriau suprasti, patikrinkite toliau pateiktą kodo fragmentą:
Kaip matome išvestyje, stačiakampis tarnauja kaip sritis, kurią paspaudus nukreipiamas vartotojas į nurodytą nuorodą.
Ištraukite komentarus iš PDF
Naudodami pypdf biblioteką galime išgauti komentarus iš PDF. Pakartojame visus PDF puslapių komentarus ir tada naudojame metodą get_object, kad gautume komentaro objektą. Tada iš objekto išgauname atitinkamą informaciją. Norėdami gauti daugiau informacijos, patikrinkite toliau pateiktą kodo fragmentą:
Kaip matome žemiau esančioje ekrano kopijoje, programa grąžino komentaro tipą ir komentarų koordinates PDF dokumente:
Išvada
„Pypdf“ suteikia „Python“ kūrėjams galimybę į PDF failus įtraukti įvairių tipų komentarus ir pasiekti esminę informaciją apie komentarus, pvz., jų tipą ir vietą, todėl tai yra praktiškas pasirinkimas atliekant užduotis, kurioms reikia pridėti komentarų ir išgauti duomenis apie komentarus.