Open Source Python PDF Metadata Library
Bezplatná a otevřená knihovna Python pro čtení a aktualizaci metadat dokumentů PDF.
Co je pypdf?
Pypdf je všestranná open source python knihovna známá pro svou rozmanitou sadu funkcí pro manipulaci s PDF. Tato knihovna se hodí pro různé manipulace s PDF, jako je analýza PDF a rozdělení a sloučení PDF atd., ale v této recenzi produktu se zaměříme pouze na funkce správy metadat PDF.
Níže jsou uvedeny hlavní rysy pypdf související s metadaty:
- Čtení metadat PDF: Vlastnosti (jako je autor, tvůrce, producent, název, předmět a klíčová slova) dokumentů PDF můžete číst pomocí pypdf.
- Aktualizace metadat PDF: Metadata dokumentů PDF můžete aktualizovat také pomocí pypdf.
Začínáme s pypdf
K instalaci a používání pypdf potřebujete Python verze 3.6.0 nebo vyšší. Nejprve tedy nainstalujte Python a poté pomocí níže uvedených příkazů nainstalujte pypdf do svého počítače pomocí pip a virtuální prostředí.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
Operační Systém Mac
python -m venv venv
source venv/bin/activate
pip install pypdf
Okna
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Čtení metadat PDF
Metadata dokumentu PDF můžeme číst pomocí knihovny pypdf. Metadata PDF získáme z vlastnosti metadata třídy PdfReader v knihovně pypdf. Podrobnosti naleznete v následujícím fragmentu kódu:
Výstup
Níže uvedený snímek obrazovky zobrazuje metadata poskytnutého souboru PDF:
Aktualizace metadat PDF
Můžeme také aktualizovat metadata dokumentu PDF, jako je autor, producent, předmět a název atd. pomocí knihovny pypdf. Objekt obsahující informace o metadatech předáme metodě add_metadata třídy PdfWriter v knihovně pypdf za účelem aktualizace/zápisu metadat dokumentu PDF. Podrobnosti naleznete v následujícím úryvku kódu:
Závěr
Závěrem lze říci, že pypdf se ukazuje jako výjimečná knihovna Pythonu pro čtení a aktualizaci metadat dokumentů PDF. Vývojáři mohou snadno bez problémů číst a aktualizovat metadata dokumentů PDF.