Biblioteca de metadades PDF Python de codi obert

Biblioteca de Python gratuïta i de codi obert per llegir i actualitzar metadades de documents PDF.

Què és pypdf?

Pypdf és una biblioteca Python de codi obert versàtil coneguda pel seu conjunt divers de funcions per a la manipulació de PDF. Aquesta biblioteca és útil per a diverses manipulacions de PDF com l'anàlisi de PDF i la divisió i fusió de PDF , etc., però en aquesta revisió del producte, només ens centrarem en les seves funcions de gestió de metadades PDF.

A continuació es mostren les principals característiques de pypdf relacionades amb les metadades:

  • Llegir metadades PDF: podeu llegir propietats (com ara autor, creador, productor, títol, tema i paraules clau) dels documents PDF mitjançant pypdf.
  • Actualitza les metadades del PDF: també pots actualitzar les metadades dels documents PDF amb pypdf.
GitHub

Estadístiques de GitHub

Nom:
Llenguatge:
Estrelles:
Forquilles:
Llicència:
El repositori es va actualitzar per última vegada a

Primers passos amb pypdf

Necessiteu la versió 3.6.0 o superior de Python per instal·lar i utilitzar pypdf. Per tant, primer instal·leu Python i després utilitzeu les ordres següents per instal·lar pypdf a la vostra màquina mitjançant pip i entorn virtual.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

MacOS


python -m venv venv
source venv/bin/activate
pip install pypdf

Windows


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Lectura de metadades de PDF

Podem llegir les metadades d'un document PDF mitjançant la biblioteca pypdf. Obtindrem les metadades d'un PDF de la propietat metadades de la classe PdfReader de la biblioteca pypdf. Comproveu el fragment de codi següent per obtenir més informació:

Sortida

A continuació, la captura de pantalla mostra les metadades del fitxer PDF proporcionat:

Actualització de les metadades del PDF

També podem actualitzar les metadades d'un document PDF com autor, productor, tema i títol, etc. mitjançant la biblioteca pypdf. Passarem un objecte que conté la informació de metadades al mètode add_metadata de la classe PdfWriter a la biblioteca pypdf per actualitzar/escriure metadades del document PDF. Per obtenir més informació, consulteu el fragment de codi següent:

Conclusió

En conclusió, pypdf demostra ser una biblioteca Python excepcional per llegir i actualitzar metadades de documents PDF. Els desenvolupadors poden llegir i actualitzar fàcilment les metadades dels documents PDF sense cap problema.

Productes Similars

 Catalan