Open Source Python Metadata Library för PDF-dokument

Gratis & öppen källkod Python-bibliotek för att läsa, redigera och uppdatera metadata för PDF-filer.

Vad är PikePDF för Python?

PikePDF är ett modernt Python-bibliotek skräddarsytt för sömlös PDF-manipulation, med kraftfulla funktioner för att arbeta specifikt med metadata. Byggt på det robusta QPDF-biblioteket tillåter PikePDF utvecklare att enkelt lägga till, redigera och ta bort metadata från PDF-filer, vilket gör det till ett viktigt verktyg för att organisera och berika dokumentinformation. Oavsett om du behöver uppdatera titlar, författare, ämnesfält eller anpassade metadataposter, tillhandahåller PikePDF ett pytoniskt och intuitivt API för att hantera dessa detaljer programmatiskt. Den stöder också hantering av inbäddad metadata för förbättrad dokumentklassificering och sökbarhet, vilket säkerställer överensstämmelse med arbetsflöden som är mycket beroende av detaljerade dokumentbeskrivningar. Med sitt fokus på tillförlitlighet och prestanda är PikePDF idealiskt för att automatisera metadatahanteringsuppgifter i dokumentbehandlingssystem eller förbättra metadatadrivna PDF-arbetsflöden.

Funktioner i PikePDF API

PikePDF API for Python has rich set of features for working with the metadata of the PDF documents. Some of its features are as listed below.

PDF-manipulation: Slå ihop, dela, rotera och ordna om sidor i PDF-filer.
Hantering av metadata: Lägg till, redigera eller ta bort metadata för att förbättra PDF-organisationen och -informationen.
Kryptering och säkerhet: Kryptera PDF-filer med lösenord, lås upp säkra PDF-filer och hantera säkerhetsinställningar.
Reparera korrupta filer: Upptäck och åtgärda problem i skadade eller korrupta PDF-dokument.
PDF/A-konvertering: Konvertera PDF-filer till PDF/A-format för långsiktig arkivering och efterlevnad.
Stöd för inbäddade teckensnitt: Hantera inbäddade teckensnitt för textkonsistens och kompatibilitet.
Prestandaorienterad: Optimerad för snabb och pålitlig drift med stora eller komplexa PDF-filer.
Baserat på QPDF: Utnyttjar det kraftfulla QPDF-biblioteket för avancerade PDF-manipuleringsfunktioner.
Öppen källkod: Gratis att använda och underhålls aktivt av utvecklargemenskapen.

Fördelar med att använda PikePDF API

Metadatahantering: Lägg enkelt till, redigera eller ta bort metadata för att förbättra PDF-organisationen och sökbarheten.
PDF/A-stöd: Konvertera PDF-filer till arkivformat samtidigt som du bevarar eller uppdaterar metadata.
Korruptionshantering: Reparera och återställ skadade PDF-filer utan att förlora metadata.
Kryptering och säkerhet: Hantera lösenordsskydd och kryptering med bibehållen metadataintegritet.
Anpassad metadata: Lägg till anpassade fält för att skräddarsy PDF-metadata för specifika arbetsflöden eller affärskrav.
Hög prestanda: Optimerad för snabb och effektiv bearbetning av stora och komplexa PDF-filer.
Öppen källkod: Gratis och aktivt underhållen, erbjuder en pålitlig och kostnadseffektiv lösning.
Baserat på QPDF: Utnyttjar de kraftfulla funktionerna i QPDF för avancerade PDF- och metadataoperationer.

Komma igång med PikePDF API för Python

GitHub-statistik

Namn:
Språk:
Stjärnor:
Gafflar:
Licens:
Repository uppdaterades senast kl

Om du använder PikePDF i dina Python-applikationer måste du installera Python 3.9+ version på ditt system. Så installera först Python och använd sedan nedanstående kommandon för att installera Hachoir API på din maskin med pip och virtuell miljö.


pip install pikepdf

Arbeta med PikePDF API för Python - Exempel

Du kan använda PikePDF för att läsa, skriva och uppdatera metadatainformation för PDF-filer. API:et tillhandahåller lättanvända metoder och exempel för att arbeta med PDF-filer från dina Python-applikationer.

Läs metadatainformation för en fil med PikePDF API för Python

Det är enkelt att läsa metadatainformation från PDF-fil med PikePDF-fil. Du kan använda följande exempelkod för att läsa metadatainformationen från alla PDF-dokument.

Produktion

När du kör den här koden kommer utdata att vara något liknande följande:


PDF Metadata:
/Title: Sample PDF Document
/Author: John Doe
/Subject: Example Usage
/Producer: Adobe PDF Library
/CreationDate: D:20241226093000Z

Om ingen metadatainformation finns tillgänglig i filen kommer utdata att vara tom.

Skriv metadatainformation till en PDF-fil med PikePDF API för Python

PikePDF kan skriva eller uppdatera metadata för en PDF-fil. Biblioteket låter dig ändra befintliga metadatafält eller lägga till nya. Här är ett exempel som visar hur man uppdaterar metadata i en PDF-fil:

Här är några vanliga standardfält som du kan uppdatera:


Title: The title of the document.
Author: The author of the document.
Subject: The subject or topic of the document.
Keywords: Keywords associated with the document for search purposes.
Creator: The application that created the document.
Producer: The software that generated the PDF.
CreationDate: The date the document was created.
ModDate: The date the document was last modified.

Slutsats för PikePDF API

PikePDF is a powerful and user-friendly Python library that simplifies the handling of PDF files, especially for metadata management. Built on the robust QPDF library, it offers seamless capabilities to read, write, and update metadata fields, enabling developers to organize, enrich, and customize PDF documents effectively. In addition to metadata operations, PikePDF excels at tasks like repairing corrupt PDFs, managing encryption, and converting files to PDF/A format, making it a versatile tool for a wide range of PDF-related workflows. Its open-source nature, active maintenance, and Pythonic API make it an excellent choice for developers looking for a reliable and efficient solution for PDF processing and metadata management. Whether you’re automating document workflows, ensuring compliance with archival standards, or enhancing PDF metadata for searchability, PikePDF provides the tools you need to work with PDFs effortlessly.