Biblioteca de metadades PDF Python de codi obert
Biblioteca de Python gratuïta i de codi obert per llegir i actualitzar metadades de documents PDF.
Què és pypdf?
Pypdf és una biblioteca Python de codi obert versàtil coneguda pel seu conjunt divers de funcions per a la manipulació de PDF. Aquesta biblioteca és útil per a diverses manipulacions de PDF com l'anàlisi de PDF i la divisió i fusió de PDF , etc., però en aquesta revisió del producte, només ens centrarem en les seves funcions de gestió de metadades PDF.
A continuació es mostren les principals característiques de pypdf relacionades amb les metadades:
- Llegir metadades PDF: podeu llegir propietats (com ara autor, creador, productor, títol, tema i paraules clau) dels documents PDF mitjançant pypdf.
- Actualitza les metadades del PDF: també pots actualitzar les metadades dels documents PDF amb pypdf.
Primers passos amb pypdf
Necessiteu la versió 3.6.0 o superior de Python per instal·lar i utilitzar pypdf. Per tant, primer instal·leu Python i després utilitzeu les ordres següents per instal·lar pypdf a la vostra màquina mitjançant pip i entorn virtual.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Lectura de metadades de PDF
Podem llegir les metadades d'un document PDF mitjançant la biblioteca pypdf. Obtindrem les metadades d'un PDF de la propietat metadades de la classe PdfReader de la biblioteca pypdf. Comproveu el fragment de codi següent per obtenir més informació:
Sortida
A continuació, la captura de pantalla mostra les metadades del fitxer PDF proporcionat:
Actualització de les metadades del PDF
També podem actualitzar les metadades d'un document PDF com autor, productor, tema i títol, etc. mitjançant la biblioteca pypdf. Passarem un objecte que conté la informació de metadades al mètode add_metadata de la classe PdfWriter a la biblioteca pypdf per actualitzar/escriure metadades del document PDF. Per obtenir més informació, consulteu el fragment de codi següent:
Conclusió
En conclusió, pypdf demostra ser una biblioteca Python excepcional per llegir i actualitzar metadades de documents PDF. Els desenvolupadors poden llegir i actualitzar fàcilment les metadades dels documents PDF sense cap problema.