Biblioteka metadanych PDF w języku Python typu open source

Bezpłatna biblioteka Pythona o otwartym kodzie źródłowym do odczytywania i aktualizowania metadanych dokumentów PDF.

Co to jest pypdf?

Pypdf to wszechstronna biblioteka Pythona o otwartym kodzie źródłowym, znana z różnorodnego zestawu funkcji do manipulacji plikami PDF. Ta biblioteka jest przydatna do różnych manipulacji plikami PDF, takich jak analizowanie plików PDF i dzielenie i łączenie plików PDF itp., ale w tej recenzji produktu skupimy się wyłącznie na funkcjach zarządzania metadanymi PDF.

Poniżej przedstawiono główne cechy pypdf związane z metadanymi:

  • Odczyt metadanych PDF: możesz czytać właściwości (takie jak autor, twórca, producent, tytuł, temat i słowa kluczowe) dokumentów PDF za pomocą pypdf.
  • Aktualizuj metadane PDF: możesz także aktualizować metadane dokumentów PDF za pomocą pypdf.
GitHub

Statystyki GitHuba

Nazwa:
Język:
Gwiazdy:
Widły:
Licencja:
Repozytorium zostało ostatnio zaktualizowane o godzinie

Pierwsze kroki z pypdf

Aby zainstalować i używać pypdf, potrzebujesz języka Python w wersji 3.6.0 lub nowszej. Zatem najpierw zainstaluj Python, a następnie użyj poniższych poleceń, aby zainstalować pypdf na swoim komputerze za pomocą pip i środowisko wirtualne.

Linuksa


python3 -m venv venv
source venv/bin/activate
pip install pypdf

System operacyjny Mac


python -m venv venv
source venv/bin/activate
pip install pypdf

Okna


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Czytanie metadanych plików PDF

Metadane dokumentu PDF możemy odczytać za pomocą biblioteki pypdf. Metadane pliku PDF otrzymamy z właściwości metadata klasy PdfReader w bibliotece pypdf. Sprawdź poniższy fragment kodu, aby poznać szczegóły:

Poniższy zrzut ekranu przedstawia metadane dostarczonego pliku PDF:

Aktualizowanie metadanych pliku PDF

Możemy także aktualizować metadane dokumentu PDF, takie jak autor, producent, temat i tytuł itp., korzystając z biblioteki pypdf. Przekażemy obiekt zawierający informacje o metadanych do metody add_metadata klasy PdfWriter w bibliotece pypdf w celu aktualizacji/zapisu metadanych dokumentu PDF. Aby uzyskać szczegółowe informacje, sprawdź poniższy fragment kodu:

Wniosek

Podsumowując, pypdf okazuje się wyjątkową biblioteką Pythona do odczytywania i aktualizowania metadanych dokumentów PDF. Programiści mogą bez problemu czytać i aktualizować metadane dokumentów PDF.

Podobne Produkty

 Polish