Open Source Python PDF-annotatiebibliotheek

Probeer deze gratis en open source Python-bibliotheek voor het toevoegen en extraheren van annotaties uit PDF-documenten.

Wat is pypdf?

Pypdf is een gratis en open-source Python-bibliotheek die bekend staat om zijn gevarieerde reeks functies voor het verwerken van PDF-documenten in een Python-omgeving. Deze tool is handig voor verschillende PDF-manipulaties, maar we zullen ons in deze recensie concentreren op de annotatiegerelateerde functies.

Opvallende kenmerken van pypdf gerelateerd aan annotaties zijn onder meer:

  • Vormannotaties toevoegen: We kunnen vormen zoals lijnen, rechthoeken, ellipsen en polygonen etc. op specifieke gebieden van PDF-pagina's tekenen als annotaties.
  • Tekstannotaties toevoegen: We kunnen tekstannotaties toevoegen aan specifieke posities van PDF-pagina's.
  • Linkannotaties toevoegen: het is mogelijk om ook linkannotaties (zoals een hyperlink) aan PDF-documenten toe te voegen.
  • Annotaties extraheren: we kunnen informatie over alle annotaties in een PDF-document itereren en extraheren met behulp van de pypdf-bibliotheek.
GitHub

GitHub-statistieken

Naam:
Taal:
Sterren:
Vorken:
Licentie:
De opslagplaats is voor het laatst bijgewerkt op

Aan de slag met pypdf

Je hebt Python versie 3.6.0 of hoger nodig om pypdf te installeren en te gebruiken. Installeer dus eerst Python en gebruik vervolgens de onderstaande opdrachten om pypdf op uw computer te installeren met behulp van pip en virtuele omgeving.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

MacOS


python -m venv venv
source venv/bin/activate
pip install pypdf

ramen


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Rechthoekige annotatie toevoegen aan PDF

We kunnen rechthoekige annotaties toevoegen aan PDF-documenten met behulp van de pypdf-bibliotheek. We zullen de klasse Rectangle van de module pypdf.annotations uit de bibliotheek pypdf gebruiken om de rechthoek te definiëren. Vervolgens gebruiken we de methode add_annotations van de klasse PDFWriter om rechthoekige annotaties aan de PDF toe te voegen.

Bekijk het onderstaande codefragment voor de details:

In onderstaande schermafbeelding kun je zien dat een rechthoek is toegevoegd om het Open Source-woord te annoteren:

Voeg tekstannotatie toe aan PDF

We maken tekstannotaties met de klasse Text uit de module pypdf.annotations van de bibliotheek pypdf. Daarna kunnen we de methode add_annotations van de klasse PDFWriter uit de bibliotheek pypdf gebruiken om annotaties aan de PDF toe te voegen. De tekstannotatie wordt toegevoegd als een pictogram dat wordt uitgevouwen en de tekst wordt weergegeven wanneer op het pictogram wordt geklikt. Bekijk het onderstaande codefragment voor de details:

Zoals we in de onderstaande screencast kunnen zien, voegt bovenstaande code op de opgegeven positie een pictogram toe aan de PDF, dat tekstannotatie toont wanneer op het pictogram wordt geklikt:

Voeg linkannotatie toe aan PDF

Linkannotaties worden gemaakt met behulp van de klasse Link uit de module pypdf.annotations. Het probleem met de linkannotatie is echter dat deze alleen de link toevoegt, maar niet zichtbaar is. Om dit probleem aan te pakken, zullen we een rechthoek opnemen met behulp van de klasse Rectangle uit de module pypdf.annotations, zoals we eerder hebben uitgelegd. Op deze manier kan de gebruiker de locatie waar de linkannotatie is toegevoegd visueel identificeren. Bekijk het onderstaande codefragment voor een beter begrip:

Zoals we in de uitvoer kunnen zien, dient de rechthoek als een gebied dat, wanneer erop wordt geklikt, de gebruiker doorverwijst naar de opgegeven link.

Extraheer annotaties uit PDF

We kunnen annotaties uit een PDF extraheren met behulp van de pypdf-bibliotheek. We doorlopen alle annotaties op PDF-pagina's en gebruiken vervolgens de methode get_object om het annotatieobject op te halen. Vervolgens halen we relevante informatie uit het object. Bekijk het onderstaande codefragment voor de details:

Zoals we in onderstaande schermafbeelding kunnen zien, heeft het programma het annotatietype en de coördinaten van de annotaties in het PDF-document geretourneerd:

Conclusie

Pypdf stelt Python-ontwikkelaars in staat om verschillende soorten annotaties aan PDF's toe te voegen en toegang te krijgen tot essentiële informatie over annotaties, zoals hun type en locatie, waardoor het een praktische keuze is voor taken waarbij het toevoegen van annotaties en het extraheren van gegevens over annotaties vereist is.

Vergelijkbare Producten

 Nederlands