Biblioteca de metadate PDF Python cu sursă deschisă

Bibliotecă Python gratuită și open source pentru a citi și actualiza metadatele documentelor PDF.

Ce este pypdf?

Pypdf este o bibliotecă python versatilă cu sursă deschisă, cunoscută pentru setul său divers de caracteristici pentru manipularea PDF-urilor. Această bibliotecă este utilă pentru diverse manipulări PDF, cum ar fi parsarea PDF și divizarea și îmbinarea PDF-ului etc., dar în această recenzie a produsului, ne vom concentra doar pe caracteristicile sale de gestionare a metadatelor PDF.

Următoarele sunt principalele caracteristici ale pypdf legate de metadate:

  • Citiți metadatele PDF: puteți citi proprietățile (cum ar fi autor, creator, producător, titlu, subiect și cuvinte cheie) ale documentelor PDF folosind pypdf.
  • Actualizați metadatele PDF: puteți, de asemenea, actualiza metadatele documentelor PDF folosind pypdf.
GitHub

GitHub Stats

Name:
Language:
Stars:
Forks:
License:
Repository was last updated at

Noțiuni introductive cu pypdf

Aveți nevoie de versiunea Python 3.6.0 sau mai mare pentru a instala și utiliza pypdf. Deci, mai întâi instalați Python și apoi utilizați comenzile de mai jos pentru a instala pypdf pe computer folosind pip și mediu virtual.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

MacOS


python -m venv venv
source venv/bin/activate
pip install pypdf

Windows


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Citirea metadatelor PDF

Putem citi metadatele unui document PDF folosind biblioteca pypdf. Vom obține metadatele unui PDF din proprietatea metadate a clasei PdfReader din biblioteca pypdf. Verificați fragmentul de cod de mai jos pentru detalii:

Captura de ecran de mai jos afișează metadatele fișierului PDF furnizat:

Actualizarea metadatelor PDF-ului

De asemenea, putem actualiza metadatele unui document PDF, cum ar fi autorul, producătorul, subiectul și titlul etc. folosind biblioteca pypdf. Vom trece un obiect care conține informațiile despre metadate la metoda add_metadata a clasei PdfWriter din biblioteca pypdf pentru a actualiza/scrie metadatele documentului PDF. Pentru detalii, verificați fragmentul de cod de mai jos:

Concluzie

În concluzie, pypdf se dovedește a fi o bibliotecă Python excepțională pentru citirea și actualizarea metadatelor documentelor PDF. Dezvoltatorii pot citi și actualiza cu ușurință metadatele documentelor PDF fără probleme.

Similar Products

 Romanian