Open Source Python PDF-annoteringsbibliotek
Prøv dette gratis og åpen kildekode Python-biblioteket for å legge til og trekke ut merknader fra PDF-dokumenter.
Hva er pypdf?
Pypdf er et gratis og åpen kildekode python-bibliotek kjent for sitt mangfoldige sett med funksjoner for håndtering av PDF-dokumenter i python-miljø. Dette verktøyet kommer godt med for ulike PDF-manipulasjoner, men vi vil fokusere på dets merknadsrelaterte funksjoner i denne anmeldelsen.
Bemerkelsesverdige funksjoner i pypdf relatert til merknader inkluderer:
- Legge til formkommentarer: Vi kan tegne former som linjer, rektangler, ellipser og polygoner osv. på bestemte områder av PDF-sider som merknader.
- Legge til tekstkommentarer: Vi kan legge til tekstkommentarer til bestemte posisjoner på PDF-sider.
- Legge til lenkekommentarer: Det er også mulig å legge til lenkemerknader (som en hyperkobling) til PDF-dokumenter.
- Trekke ut merknader: Vi kan iterere og trekke ut informasjon om alle merknader i et PDF-dokument ved å bruke pypdf-biblioteket.
Komme i gang med pypdf
Du trenger Python versjon 3.6.0 eller høyere for å installere og bruke pypdf. Så installer først Python og bruk deretter kommandoene nedenfor for å installere pypdf på maskinen din ved å bruke pip og virtuelt miljø a>.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
Mac os
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Legg til rektangelkommentar til PDF
Vi kan legge til rektangulære merknader til PDF-dokumenter ved å bruke pypdf-biblioteket. Vi vil bruke Rektangel-klassen til pypdf.annotations-modulen fra pypdf-biblioteket for å definere rektangelet. Deretter vil vi bruke add_annotations-metoden for PDFWriter-klassen for å legge til rektangelkommentarer til PDF-en.
Sjekk kodebiten nedenfor for detaljer:
I skjermbildet nedenfor kan du se at rektangel er lagt til for å kommentere Åpen kildekode-ordet:
Legg til tekstanmerkning til PDF
Vi lager tekstkommentarer ved å bruke Tekst-klassen fra pypdf.annotations-modulen i pypdf-biblioteket. Etter det kan vi bruke add_annotations-metoden for PDFWriter-klassen fra pypdf-biblioteket for å legge til merknader til PDF-en. Tekstkommentaren legges til som et ikon som utvides og viser teksten når ikonet klikkes. Sjekk kodebiten nedenfor for detaljer:
Som vi kan se i skjermbildet nedenfor, legger koden ovenfor et ikon til PDF-en på spesifisert posisjon som viser tekstkommentarer når ikonet klikkes:
Legg til lenkekommentar til PDF
Linkkommentarer opprettes ved å bruke Link-klassen fra pypdf.annotations-modulen. Imidlertid er problemet med lenkekommentaren at den bare legger til lenken, men den er ikke synlig. For å løse dette problemet vil vi inkludere et rektangel ved å bruke Rektangel-klassen fra pypdf.annotations-modulen som vi forklarte tidligere. På denne måten kan brukeren visuelt identifisere stedet der lenkekommentaren er lagt til. Sjekk kodebiten nedenfor for bedre forståelse:
Som vi kan se i utdataene, fungerer rektangelet som et område som, når det klikkes, omdirigerer brukeren til den angitte lenken.
Trekk ut merknader fra PDF
Vi kan trekke ut merknader fra en PDF ved å bruke pypdf-biblioteket. Vi itererer gjennom alle merknader på PDF-sider og bruker deretter get_object-metoden for å hente merknadsobjektet. Deretter trekker vi ut relevant informasjon fra objektet. Sjekk kodebiten nedenfor for detaljer:
Som vi kan se i skjermbildet nedenfor, har programmet returnert merknadstypen og koordinatene til merknadene i PDF-dokumentet:
Konklusjon
Pypdf gir Python-utviklere mulighet til å legge til forskjellige typer merknader til PDF-er og få tilgang til viktig informasjon om merknader, for eksempel type og plassering, noe som gjør det til et praktisk valg for oppgaver som krever å legge til merknader og trekke ut data om merknader.