Open Source Python PDF Annotation Library

Prova detta Python-bibliotek med gratis och öppen källkod för att lägga till och extrahera kommentarer från PDF-dokument.

Vad är pypdf?

Pypdf är ett gratis pythonbibliotek med öppen källkod känt för sin mångsidiga uppsättning funktioner för att hantera PDF-dokument i pythonmiljö. Det här verktyget är praktiskt för olika PDF-manipulationer men vi kommer att fokusera på dess anteckningsrelaterade funktioner i den här recensionen.

Anmärkningsvärda funktioner i pypdf relaterade till kommentarer inkluderar:

  • Lägga till formkommentarer: Vi kan rita former som linjer, rektanglar, ellipser och polygoner etc. på specifika områden av PDF-sidor som kommentarer.
  • Lägga till textkommentarer: Vi kan lägga till textkommentarer till specifika positioner på PDF-sidor.
  • Lägga till länkkommentarer: Det är möjligt att även lägga till länkkommentarer (som en hyperlänk) till PDF-dokument.
  • Extrahera kommentarer: Vi kan iterera och extrahera information om alla kommentarer i ett PDF-dokument med hjälp av pypdf-biblioteket.
GitHub

GitHub-statistik

Namn:
Språk:
Stjärnor:
Gafflar:
Licens:
Repository uppdaterades senast kl

Komma igång med pypdf

Du behöver Python version 3.6.0 eller senare för att installera och använda pypdf. Så installera först Python och använd sedan nedanstående kommandon för att installera pypdf på din maskin med pip och virtuell miljö a>.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

MacOS


python -m venv venv
source venv/bin/activate
pip install pypdf

Windows


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Lägg till rektangelkommentar till PDF

Vi kan lägga till rektangelkommentarer till PDF-dokument med hjälp av pypdf-biblioteket. Vi kommer att använda klassen Rektangel i modulen pypdf.annotations från pypdf-biblioteket för att definiera rektangeln. Sedan använder vi metoden add_annotations i klassen PDFWriter för att lägga till rektangelkommentarer till PDF-filen.

Kontrollera nedanstående kodavsnitt för detaljer:

Produktion

I skärmbilden nedan kan du se att rektangel läggs till för att kommentera Öppen källkod-ord:

Lägg till textkommentar till PDF

Vi skapar textkommentarer med klassen Text från modulen pypdf.annotations i pypdf-biblioteket. Efter det kan vi använda metoden add_annotations för klassen PDFWriter från pypdf-biblioteket för att lägga till anteckningar till PDF-filen. Textkommentaren läggs till som en ikon som expanderar och visar texten när ikonen klickas. Kontrollera nedanstående kodavsnitt för detaljer:

Produktion

Som vi kan se i skärmdumpen nedan lägger ovanstående kod till en ikon till PDF-filen på angiven plats som visar textkommentarer när ikonen klickas:

Lägg till länkkommentar till PDF

Länkkommentarer skapas med klassen Link från modulen pypdf.annotations. Men problemet med länkanteckningen är att den bara lägger till länken men den är inte synlig. För att lösa detta problem kommer vi att införliva en rektangel med klassen Rektangel från modulen pypdf.annotations som vi förklarade tidigare. På så sätt kan användaren visuellt identifiera platsen där länkkommentaren läggs till. Kontrollera nedanstående kodavsnitt för bättre förståelse:

Produktion

Som vi kan se i utgången fungerar rektangeln som ett område som, när den klickas, omdirigerar användaren till den angivna länken.

Extrahera kommentarer från PDF

Vi kan extrahera kommentarer från en PDF med hjälp av pypdf-biblioteket. Vi itererar igenom alla anteckningar på PDF-sidor och använder sedan metoden get_object för att hämta anteckningsobjektet. Sedan extraherar vi relevant information från objektet. Kontrollera nedanstående kodavsnitt för detaljer:

Produktion

Som vi kan se i skärmdumpen nedan har programmet returnerat anteckningstypen och koordinaterna för anteckningarna i PDF-dokumentet:

Slutsats

Pypdf ger Python-utvecklare möjlighet att lägga till olika typer av kommentarer till PDF-filer och få tillgång till viktig information om anteckningar, såsom deras typ och plats, vilket gör det till ett praktiskt val för uppgifter som kräver att lägga till anteckningar och extrahera data om anteckningar.

Liknande Produkter

 Swedish