Biblioteka metadanych PDF w języku Python typu open source
Bezpłatna biblioteka Pythona o otwartym kodzie źródłowym do odczytywania i aktualizowania metadanych dokumentów PDF.
Co to jest pypdf?
Pypdf to wszechstronna biblioteka Pythona o otwartym kodzie źródłowym, znana z różnorodnego zestawu funkcji do manipulacji plikami PDF. Ta biblioteka jest przydatna do różnych manipulacji plikami PDF, takich jak analizowanie plików PDF i dzielenie i łączenie plików PDF itp., ale w tej recenzji produktu skupimy się wyłącznie na funkcjach zarządzania metadanymi PDF.
Poniżej przedstawiono główne cechy pypdf związane z metadanymi:
- Odczyt metadanych PDF: możesz czytać właściwości (takie jak autor, twórca, producent, tytuł, temat i słowa kluczowe) dokumentów PDF za pomocą pypdf.
- Aktualizuj metadane PDF: możesz także aktualizować metadane dokumentów PDF za pomocą pypdf.
Pierwsze kroki z pypdf
Aby zainstalować i używać pypdf, potrzebujesz języka Python w wersji 3.6.0 lub nowszej. Zatem najpierw zainstaluj Python, a następnie użyj poniższych poleceń, aby zainstalować pypdf na swoim komputerze za pomocą pip i środowisko wirtualne.
Linuksa
python3 -m venv venv
source venv/bin/activate
pip install pypdf
System operacyjny Mac
python -m venv venv
source venv/bin/activate
pip install pypdf
Okna
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Czytanie metadanych plików PDF
Metadane dokumentu PDF możemy odczytać za pomocą biblioteki pypdf. Metadane pliku PDF otrzymamy z właściwości metadata klasy PdfReader w bibliotece pypdf. Sprawdź poniższy fragment kodu, aby poznać szczegóły:
Poniższy zrzut ekranu przedstawia metadane dostarczonego pliku PDF:
Aktualizowanie metadanych pliku PDF
Możemy także aktualizować metadane dokumentu PDF, takie jak autor, producent, temat i tytuł itp., korzystając z biblioteki pypdf. Przekażemy obiekt zawierający informacje o metadanych do metody add_metadata klasy PdfWriter w bibliotece pypdf w celu aktualizacji/zapisu metadanych dokumentu PDF. Aby uzyskać szczegółowe informacje, sprawdź poniższy fragment kodu:
Wniosek
Podsumowując, pypdf okazuje się wyjątkową biblioteką Pythona do odczytywania i aktualizowania metadanych dokumentów PDF. Programiści mogą bez problemu czytać i aktualizować metadane dokumentów PDF.