Open Source Python Metadata Library pro dokumenty PDF
Bezplatná a open source knihovna Python pro čtení, úpravu a aktualizaci metadat souborů PDF.
Co je PikePDF pro Python?
PikePDF je moderní knihovna Pythonu přizpůsobená pro bezproblémovou manipulaci s PDF, s výkonnými možnostmi pro práci konkrétně s metadaty. PikePDF, postavený na robustní knihovně QPDF, umožňuje vývojářům snadno přidávat, upravovat a odstraňovat metadata ze souborů PDF, což z něj činí základní nástroj pro organizování a obohacování informací o dokumentech. Ať už potřebujete aktualizovat názvy, autory, pole předmětu nebo vlastní položky metadat, PikePDF poskytuje Pythonic a intuitivní API pro správu těchto podrobností programově. Podporuje také zpracování vložených metadat pro vylepšenou klasifikaci dokumentů a možnosti vyhledávání, čímž je zajištěna shoda s pracovními postupy, které do značné míry spoléhají na podrobné popisy dokumentů. Se svým zaměřením na spolehlivost a výkon je PikePDF ideální pro automatizaci úloh správy metadat v systémech zpracování dokumentů nebo pro vylepšení pracovních postupů PDF založených na metadatech.
Vlastnosti PikePDF API
PikePDF API for Python has rich set of features for working with the metadata of the PDF documents. Some of its features are as listed below.- Manipulace s PDF: Slučujte, rozdělujte, otáčejte a změňte pořadí stránek v souborech PDF.
- Zpracování metadat: Přidejte, upravte nebo odstraňte metadata, abyste zlepšili organizaci PDF a informace.
- Šifrování a zabezpečení: Šifrujte soubory PDF pomocí hesel, odemykejte zabezpečené soubory PDF a spravujte nastavení zabezpečení.
- Opravit poškozené soubory: Zjistěte a opravte problémy v poškozených nebo poškozených dokumentech PDF.
- Konverze PDF/A: Převeďte soubory PDF do formátu PDF/A pro dlouhodobou archivaci a shodu.
- Podpora vložených písem: Zpracujte vložená písma pro konzistenci a kompatibilitu textu.
- Orientované na výkon: Optimalizováno pro rychlé a spolehlivé operace s velkými nebo složitými soubory PDF.
- Založeno na QPDF: Využívá výkonnou knihovnu QPDF pro pokročilé možnosti manipulace s PDF.
- Otevřený zdroj: Zdarma k použití a aktivně spravovaný komunitou vývojářů.
Výhody použití PikePDF API
- Správa metadat: Snadno přidávejte, upravujte nebo odebírejte metadata, abyste zlepšili organizaci PDF a možnosti vyhledávání.
- Podpora PDF/A: Převádějte soubory PDF do archivních formátů při zachování nebo aktualizaci metadat.
- Ošetření korupce: Opravte a obnovte poškozené soubory PDF bez ztráty metadat.
- Šifrování a zabezpečení: Spravujte ochranu heslem a šifrování při zachování integrity metadat.
- Vlastní metadata: Přidejte vlastní pole pro přizpůsobení metadat PDF konkrétním pracovním postupům nebo obchodním požadavkům.
- Vysoký výkon: Optimalizováno pro rychlé a efektivní zpracování velkých a složitých souborů PDF.
- Otevřený zdroj: Zdarma a aktivně udržovaný, nabízí spolehlivé a cenově výhodné řešení.
- Založeno na QPDF: Využívá výkonné funkce QPDF pro pokročilé operace PDF a metadat.
Začínáme s PikePDF API pro Python
Použití PikePDF ve vašich aplikacích Python bude vyžadovat instalaci verze Pythonu 3.9+ na váš systém. Nejprve tedy nainstalujte Python a poté pomocí níže uvedených příkazů nainstalujte do počítače Hachoir API pomocí pip a virtuální prostředí.
pip install pikepdf
Práce s PikePDF API pro Python - Příklady
PikePDF můžete použít pro čtení, zápis a aktualizaci informací o metadatech souborů PDF. API poskytuje snadno použitelné metody a ukázky pro práci se soubory PDF z vašich aplikací Python.
Přečtěte si informace o metadatech souboru pomocí PikePDF API pro Python
Čtení informací metadat ze souboru PDF pomocí souboru PikePDF je snadné. Následující ukázkový kód můžete použít ke čtení informací metadat z libovolného dokumentu PDF.
Výstup
Když spustíte tento kód, výstup bude poněkud podobný následujícímu:
PDF Metadata:
/Title: Sample PDF Document
/Author: John Doe
/Subject: Example Usage
/Producer: Adobe PDF Library
/CreationDate: D:20241226093000Z
Pokud v souboru nejsou k dispozici žádné informace o metadatech, bude výstup prázdný.
Zapište informace o metadatech do souboru PDF pomocí PikePDF API pro Python
PikePDF může zapisovat nebo aktualizovat metadata souboru PDF. Knihovna umožňuje upravovat stávající pole metadat nebo přidávat nová. Zde je příklad demonstrující, jak aktualizovat metadata v souboru PDF:
Zde jsou některá běžná standardní pole, která můžete aktualizovat:
Title: The title of the document.
Author: The author of the document.
Subject: The subject or topic of the document.
Keywords: Keywords associated with the document for search purposes.
Creator: The application that created the document.
Producer: The software that generated the PDF.
CreationDate: The date the document was created.
ModDate: The date the document was last modified.