Biblioteca de metadate PDF Python cu sursă deschisă
Bibliotecă Python gratuită și open source pentru a citi și actualiza metadatele documentelor PDF.
Ce este pypdf?
Pypdf este o bibliotecă python versatilă cu sursă deschisă, cunoscută pentru setul său divers de caracteristici pentru manipularea PDF-urilor. Această bibliotecă este utilă pentru diverse manipulări PDF, cum ar fi parsarea PDF și divizarea și îmbinarea PDF-ului etc., dar în această recenzie a produsului, ne vom concentra doar pe caracteristicile sale de gestionare a metadatelor PDF.
Următoarele sunt principalele caracteristici ale pypdf legate de metadate:
- Citiți metadatele PDF: puteți citi proprietățile (cum ar fi autor, creator, producător, titlu, subiect și cuvinte cheie) ale documentelor PDF folosind pypdf.
- Actualizați metadatele PDF: puteți, de asemenea, actualiza metadatele documentelor PDF folosind pypdf.
Noțiuni introductive cu pypdf
Aveți nevoie de versiunea Python 3.6.0 sau mai mare pentru a instala și utiliza pypdf. Deci, mai întâi instalați Python și apoi utilizați comenzile de mai jos pentru a instala pypdf pe computer folosind pip și mediu virtual.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Citirea metadatelor PDF
Putem citi metadatele unui document PDF folosind biblioteca pypdf. Vom obține metadatele unui PDF din proprietatea metadate a clasei PdfReader din biblioteca pypdf. Verificați fragmentul de cod de mai jos pentru detalii:
Captura de ecran de mai jos afișează metadatele fișierului PDF furnizat:
Actualizarea metadatelor PDF-ului
De asemenea, putem actualiza metadatele unui document PDF, cum ar fi autorul, producătorul, subiectul și titlul etc. folosind biblioteca pypdf. Vom trece un obiect care conține informațiile despre metadate la metoda add_metadata a clasei PdfWriter din biblioteca pypdf pentru a actualiza/scrie metadatele documentului PDF. Pentru detalii, verificați fragmentul de cod de mai jos:
Concluzie
În concluzie, pypdf se dovedește a fi o bibliotecă Python excepțională pentru citirea și actualizarea metadatelor documentelor PDF. Dezvoltatorii pot citi și actualiza cu ușurință metadatele documentelor PDF fără probleme.