Open Source Python PDF-annotatiebibliotheek

Probeer deze gratis en open source Python-bibliotheek voor het toevoegen en extraheren van aantekeningen uit PDF-documenten.

Wat is pypdf?

Pypdf is een gratis en open-source python-bibliotheek die bekend staat om zijn diverse set functies voor het verwerken van PDF-documenten in een python-omgeving. Deze tool is handig voor verschillende PDF-manipulaties, maar we zullen ons in deze review richten op de functies voor annotaties.

Opvallende kenmerken van pypdf met betrekking tot annotaties zijn onder meer:

  • Vormaantekeningen toevoegen: We kunnen vormen zoals lijnen, rechthoeken, ellipsen en veelhoeken etc. op specifieke gebieden van PDF-pagina's tekenen als aantekeningen.
  • Tekstaantekeningen toevoegen: We kunnen tekstaantekeningen toevoegen aan specifieke posities op PDF-pagina's.
  • Link-annotaties toevoegen: Het is ook mogelijk om link-annotaties (zoals een hyperlink) aan PDF-documenten toe te voegen.
  • Annotaties extraheren: Met behulp van de pypdf-bibliotheek kunnen we itereren en informatie over alle annotaties in een PDF-document extraheren.
GitHub

GitHub-statistieken

Naam:
Taal:
Sterren:
Vorken:
Licentie:
De opslagplaats is voor het laatst bijgewerkt op

Aan de slag met pypdf

Je hebt Python versie 3.6.0 of hoger nodig om pypdf te installeren en gebruiken. Installeer dus eerst Python en gebruik dan onderstaande commando's om pypdf op je machine te installeren met pip en virtual environment.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

MacOS


python -m venv venv
source venv/bin/activate
pip install pypdf

Vensters


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Rechthoekige annotatie toevoegen aan PDF

We kunnen rechthoekige annotaties toevoegen aan PDF-documenten met behulp van de pypdf-bibliotheek. We gebruiken de Rectangle-klasse van de pypdf.annotations-module uit de pypdf-bibliotheek om de rechthoek te definiëren. Vervolgens gebruiken we de add_annotations-methode van de PDFWriter-klasse om rechthoekige annotaties toe te voegen aan de PDF.

Bekijk het onderstaande codefragment voor meer informatie:

Uitvoer

In onderstaande schermafbeelding ziet u dat er een rechthoek is toegevoegd om een Open Source-woord te annoteren:

Tekstannotatie toevoegen aan PDF

We maken tekstannotaties met behulp van de Text-klasse uit de pypdf.annotations-module van de pypdf-bibliotheek. Daarna kunnen we de add_annotations-methode van de PDFWriter-klasse uit de pypdf-bibliotheek gebruiken om annotaties aan de PDF toe te voegen. De tekstannotatie wordt toegevoegd als een pictogram dat uitvouwt en de tekst toont wanneer op het pictogram wordt geklikt. Bekijk het onderstaande codefragment voor de details:

Uitvoer

Zoals u in de onderstaande screencast kunt zien, voegt de bovenstaande code een pictogram toe aan de PDF op de opgegeven positie. Wanneer u op het pictogram klikt, wordt er een tekstuele aantekening weergegeven:

Linkannotatie toevoegen aan PDF

Link-annotaties worden gemaakt met de Link-klasse van de pypdf.annotations-module. Het probleem met de link-annotatie is echter dat deze alleen de link toevoegt, maar niet zichtbaar is. Om dit probleem aan te pakken, zullen we een rechthoek opnemen met de Rectangle-klasse van de pypdf.annotations-module, zoals we eerder hebben uitgelegd. Op deze manier kan de gebruiker visueel de locatie identificeren waar de link-annotatie is toegevoegd. Bekijk het onderstaande codefragment voor een beter begrip:

Uitvoer

Zoals u in de uitvoer kunt zien, fungeert de rechthoek als een gebied dat, wanneer u erop klikt, de gebruiker doorverwijst naar de opgegeven link.

Annotaties uit PDF extraheren

We kunnen annotaties uit een PDF halen met behulp van de pypdf-bibliotheek. We itereren door alle annotaties op PDF-pagina's en gebruiken vervolgens de get_object-methode om het annotatieobject te krijgen. Vervolgens halen we relevante informatie uit het object. Bekijk het onderstaande codefragment voor de details:

Uitvoer

Zoals u in onderstaande schermafbeelding kunt zien, heeft het programma het type annotatie en de coördinaten van de annotaties in het PDF-document geretourneerd:

Conclusie

Met Pypdf kunnen Python-ontwikkelaars verschillende typen aantekeningen toevoegen aan PDF's en hebben ze toegang tot essentiële informatie over aantekeningen, zoals het type en de locatie. Dit maakt het een praktische keuze voor taken waarbij aantekeningen moeten worden toegevoegd en gegevens over aantekeningen moeten worden geëxtraheerd.

Vergelijkbare Producten

 Nederlands