Libreria di annotazione PDF Python Open Source

Prova questa libreria Python gratuita e open source per aggiungere ed estrarre annotazioni dai documenti PDF.

Che cos'è pypdf?

Pypdf è una libreria python gratuita e open source nota per il suo set eterogeneo di funzionalità per la gestione di documenti PDF in ambiente python. Questo strumento è utile per varie manipolazioni PDF, ma in questa recensione ci concentreremo sulle sue funzionalità relative alle annotazioni.

Le caratteristiche degne di nota di pypdf relative alle annotazioni includono:

  • Aggiunta di annotazioni di forme: possiamo disegnare forme come linee, rettangoli, ellissi, poligoni ecc. su aree specifiche delle pagine PDF come annotazioni.
  • Aggiunta di annotazioni di testo: possiamo aggiungere annotazioni di testo in posizioni specifiche delle pagine PDF.
  • Aggiunta di annotazioni di collegamento: è possibile anche aggiungere annotazioni di collegamento (come un collegamento ipertestuale) ai documenti PDF.
  • Estrazione di annotazioni: possiamo iterare ed estrarre informazioni su tutte le annotazioni in un documento PDF utilizzando la libreria pypdf.
GitHub

Statistiche GitHub

Nome:
Lingua:
Stelle:
Forchette:
Licenza:
L'ultimo aggiornamento del repository è avvenuto il

Introduzione a pypdf

Per installare e usare pypdf è necessaria la versione 3.6.0 o superiore di Python. Quindi, installa prima Python e poi usa i comandi sottostanti per installare pypdf sul tuo computer usando pip e ambiente virtuale.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

MacOS


python -m venv venv
source venv/bin/activate
pip install pypdf

Finestre


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Aggiungi annotazione rettangolare al PDF

Possiamo aggiungere annotazioni rettangolari ai documenti PDF usando la libreria pypdf. Utilizzeremo la classe Rectangle del modulo pypdf.annotations dalla libreria pypdf per definire il rettangolo. Quindi utilizzeremo il metodo add_annotations della classe PDFWriter per aggiungere annotazioni rettangolari al PDF.

Per i dettagli, controlla il frammento di codice qui sotto:

Produzione

Nello screenshot qui sotto puoi vedere che il rettangolo è stato aggiunto per annotare la parola Open Source:

Aggiungi annotazione di testo al PDF

Creiamo annotazioni di testo usando la classe Text dal modulo pypdf.annotations della libreria pypdf. Dopo di che possiamo usare il metodo add_annotations della classe PDFWriter dalla libreria pypdf per aggiungere annotazioni al PDF. L'annotazione di testo viene aggiunta come un'icona che si espande e mostra il testo quando si fa clic sull'icona. Controlla il frammento di codice qui sotto per i dettagli:

Produzione

Come possiamo vedere nello screencast qui sotto, il codice sopra aggiunge un'icona al PDF nella posizione specificata che mostra un'annotazione di testo quando si fa clic sull'icona:

Aggiungi annotazione collegamento al PDF

Le annotazioni di collegamento vengono create utilizzando la classe Link dal modulo pypdf.annotations. Tuttavia, il problema con l'annotazione di collegamento è che aggiunge solo il collegamento ma non è visibile. Per risolvere questo problema, incorporeremo un rettangolo utilizzando la classe Rectangle dal modulo pypdf.annotations come spiegato in precedenza. In questo modo, l'utente può identificare visivamente la posizione in cui viene aggiunta l'annotazione di collegamento. Controlla il frammento di codice seguente per una migliore comprensione:

Produzione

Come possiamo vedere nell'output, il rettangolo funge da area che, quando viene cliccata, reindirizza l'utente al collegamento specificato.

Estrarre annotazioni da PDF

Possiamo estrarre annotazioni da un PDF usando la libreria pypdf. Esaminiamo tutte le annotazioni sulle pagine PDF e poi utilizziamo il metodo get_object per ottenere l'oggetto annotazione. Quindi estraiamo informazioni rilevanti dall'oggetto. Controlla il frammento di codice qui sotto per i dettagli:

Produzione

Come possiamo vedere nello screenshot qui sotto, il programma ha restituito il tipo di annotazione e le coordinate delle annotazioni nel documento PDF:

Conclusione

Pypdf consente agli sviluppatori Python di aggiungere diversi tipi di annotazioni ai PDF e di accedere a informazioni essenziali sulle annotazioni, come il tipo e la posizione, il che lo rende una scelta pratica per le attività che richiedono l'aggiunta di annotazioni e l'estrazione di dati sulle annotazioni.

Prodotti Simili

 Italiano