Open Source Python Metadata Library pro dokumenty PDF

Bezplatná a open source knihovna Python pro čtení, úpravu a aktualizaci metadat souborů PDF.

Co je PikePDF pro Python?

PikePDF je moderní knihovna Pythonu přizpůsobená pro bezproblémovou manipulaci s PDF, s výkonnými možnostmi pro práci konkrétně s metadaty. PikePDF, postavený na robustní knihovně QPDF, umožňuje vývojářům snadno přidávat, upravovat a odstraňovat metadata ze souborů PDF, což z něj činí základní nástroj pro organizování a obohacování informací o dokumentech. Ať už potřebujete aktualizovat názvy, autory, pole předmětu nebo vlastní položky metadat, PikePDF poskytuje Pythonic a intuitivní API pro správu těchto podrobností programově. Podporuje také zpracování vložených metadat pro vylepšenou klasifikaci dokumentů a možnosti vyhledávání, čímž je zajištěna shoda s pracovními postupy, které do značné míry spoléhají na podrobné popisy dokumentů. Se svým zaměřením na spolehlivost a výkon je PikePDF ideální pro automatizaci úloh správy metadat v systémech zpracování dokumentů nebo pro vylepšení pracovních postupů PDF založených na metadatech.

Vlastnosti PikePDF API

PikePDF API for Python has rich set of features for working with the metadata of the PDF documents. Some of its features are as listed below.

Manipulace s PDF: Slučujte, rozdělujte, otáčejte a změňte pořadí stránek v souborech PDF.
Zpracování metadat: Přidejte, upravte nebo odstraňte metadata, abyste zlepšili organizaci PDF a informace.
Šifrování a zabezpečení: Šifrujte soubory PDF pomocí hesel, odemykejte zabezpečené soubory PDF a spravujte nastavení zabezpečení.
Opravit poškozené soubory: Zjistěte a opravte problémy v poškozených nebo poškozených dokumentech PDF.
Konverze PDF/A: Převeďte soubory PDF do formátu PDF/A pro dlouhodobou archivaci a shodu.
Podpora vložených písem: Zpracujte vložená písma pro konzistenci a kompatibilitu textu.
Orientované na výkon: Optimalizováno pro rychlé a spolehlivé operace s velkými nebo složitými soubory PDF.
Založeno na QPDF: Využívá výkonnou knihovnu QPDF pro pokročilé možnosti manipulace s PDF.
Otevřený zdroj: Zdarma k použití a aktivně spravovaný komunitou vývojářů.

Výhody použití PikePDF API

Správa metadat: Snadno přidávejte, upravujte nebo odebírejte metadata, abyste zlepšili organizaci PDF a možnosti vyhledávání.
Podpora PDF/A: Převádějte soubory PDF do archivních formátů při zachování nebo aktualizaci metadat.
Ošetření korupce: Opravte a obnovte poškozené soubory PDF bez ztráty metadat.
Šifrování a zabezpečení: Spravujte ochranu heslem a šifrování při zachování integrity metadat.
Vlastní metadata: Přidejte vlastní pole pro přizpůsobení metadat PDF konkrétním pracovním postupům nebo obchodním požadavkům.
Vysoký výkon: Optimalizováno pro rychlé a efektivní zpracování velkých a složitých souborů PDF.
Otevřený zdroj: Zdarma a aktivně udržovaný, nabízí spolehlivé a cenově výhodné řešení.
Založeno na QPDF: Využívá výkonné funkce QPDF pro pokročilé operace PDF a metadat.

Začínáme s PikePDF API pro Python

Statistiky GitHubu

Název:
Jazyk:
hvězdy:
Vidlice:
Licence:
Úložiště bylo naposledy aktualizováno v

Použití PikePDF ve vašich aplikacích Python bude vyžadovat instalaci verze Pythonu 3.9+ na váš systém. Nejprve tedy nainstalujte Python a poté pomocí níže uvedených příkazů nainstalujte do počítače Hachoir API pomocí pip a virtuální prostředí.


pip install pikepdf

Práce s PikePDF API pro Python - Příklady

PikePDF můžete použít pro čtení, zápis a aktualizaci informací o metadatech souborů PDF. API poskytuje snadno použitelné metody a ukázky pro práci se soubory PDF z vašich aplikací Python.

Přečtěte si informace o metadatech souboru pomocí PikePDF API pro Python

Čtení informací metadat ze souboru PDF pomocí souboru PikePDF je snadné. Následující ukázkový kód můžete použít ke čtení informací metadat z libovolného dokumentu PDF.

Výstup

Když spustíte tento kód, výstup bude poněkud podobný následujícímu:


PDF Metadata:
/Title: Sample PDF Document
/Author: John Doe
/Subject: Example Usage
/Producer: Adobe PDF Library
/CreationDate: D:20241226093000Z

Pokud v souboru nejsou k dispozici žádné informace o metadatech, bude výstup prázdný.

Zapište informace o metadatech do souboru PDF pomocí PikePDF API pro Python

PikePDF může zapisovat nebo aktualizovat metadata souboru PDF. Knihovna umožňuje upravovat stávající pole metadat nebo přidávat nová. Zde je příklad demonstrující, jak aktualizovat metadata v souboru PDF:

Zde jsou některá běžná standardní pole, která můžete aktualizovat:


Title: The title of the document.
Author: The author of the document.
Subject: The subject or topic of the document.
Keywords: Keywords associated with the document for search purposes.
Creator: The application that created the document.
Producer: The software that generated the PDF.
CreationDate: The date the document was created.
ModDate: The date the document was last modified.

Závěr pro PikePDF API

PikePDF is a powerful and user-friendly Python library that simplifies the handling of PDF files, especially for metadata management. Built on the robust QPDF library, it offers seamless capabilities to read, write, and update metadata fields, enabling developers to organize, enrich, and customize PDF documents effectively. In addition to metadata operations, PikePDF excels at tasks like repairing corrupt PDFs, managing encryption, and converting files to PDF/A format, making it a versatile tool for a wide range of PDF-related workflows. Its open-source nature, active maintenance, and Pythonic API make it an excellent choice for developers looking for a reliable and efficient solution for PDF processing and metadata management. Whether you’re automating document workflows, ensuring compliance with archival standards, or enhancing PDF metadata for searchability, PikePDF provides the tools you need to work with PDFs effortlessly.