Open Source Python Metadata Library til PDF-dokumenter

Gratis & open source Python-bibliotek til at læse, redigere og opdatere metadata af PDF-filer.

Hvad er PikePDF for Python?

PikePDF er et moderne Python-bibliotek, der er skræddersyet til problemfri PDF-manipulation, med kraftfulde funktioner til at arbejde specifikt med metadata. Bygget på det robuste QPDF-bibliotek giver PikePDF udviklere mulighed for nemt at tilføje, redigere og fjerne metadata fra PDF-filer, hvilket gør det til et vigtigt værktøj til at organisere og berige dokumentinformation. Uanset om du har brug for at opdatere titler, forfattere, emnefelter eller brugerdefinerede metadataposter, tilbyder PikePDF en pytonisk og intuitiv API til at administrere disse detaljer programmatisk. Det understøtter også håndtering af indlejrede metadata for forbedret dokumentklassificering og søgbarhed, hvilket sikrer overholdelse af arbejdsgange, der i høj grad er afhængige af detaljerede dokumentbeskrivelser. Med sit fokus på pålidelighed og ydeevne er PikePDF ideel til at automatisere metadatahåndteringsopgaver i dokumentbehandlingssystemer eller forbedre metadatadrevne PDF-arbejdsgange.

Funktioner i PikePDF API

PikePDF API for Python has rich set of features for working with the metadata of the PDF documents. Some of its features are as listed below.

PDF-manipulation: Flet, del, roter og omarranger sider i PDF-filer.
Håndtering af metadata: Tilføj, rediger eller fjern metadata for at forbedre PDF-organisation og -oplysninger.
Kryptering og sikkerhed: Krypter PDF-filer med adgangskoder, lås op for sikrede PDF-filer, og administrer sikkerhedsindstillinger.
Reparer korrupte filer: Find og ret problemer i beskadigede eller korrupte PDF-dokumenter.
PDF/A-konvertering: Konverter PDF-filer til PDF/A-format for langsigtet arkivering og overholdelse.
Indlejret skrifttypestøtte: Håndter indlejrede skrifttyper for tekstkonsistens og kompatibilitet.
Performance-orienteret: Optimeret til hurtige og pålidelige operationer med store eller komplekse PDF-filer.
Baseret på QPDF: Udnytter det kraftfulde QPDF-bibliotek til avancerede PDF-manipulationsfunktioner.
Åben kildekode: Gratis at bruge og vedligeholdes aktivt af udviklerfællesskabet.

Fordele ved at bruge PikePDF API

Metadataadministration: Tilføj, rediger eller fjern nemt metadata for at forbedre PDF-organisering og søgbarhed.
PDF/A-understøttelse: Konverter PDF'er til arkivformater, mens du bevarer eller opdaterer metadata.
Korruptionshåndtering: Reparer og gendan beskadigede PDF-filer uden at miste metadata.
Kryptering og sikkerhed: Administrer adgangskodebeskyttelse og kryptering, mens du bevarer metadataintegriteten.
Tilpassede metadata: Tilføj tilpassede felter for at skræddersy PDF-metadata til specifikke arbejdsgange eller forretningskrav.
Høj ydeevne: Optimeret til hurtig og effektiv behandling af store og komplekse PDF-filer.
Open Source: Gratis og aktivt vedligeholdt og tilbyder en pålidelig og omkostningseffektiv løsning.
Baseret på QPDF: Udnytter de kraftfulde funktioner i QPDF til avancerede PDF- og metadatahandlinger.

Kom godt i gang med PikePDF API til Python

GitHub-statistik

Navn:
Sprog:
Stjerner:
Forgafler:
Licens:
Repository blev sidst opdateret kl

Brug af PikePDF i dine Python-applikationer kræver, at du installerer Python 3.9+ version på dit system. Så installer først Python og brug derefter nedenstående kommandoer til at installere Hachoir API på din maskine ved hjælp af pip og virtuelt miljø.


pip install pikepdf

Arbejde med PikePDF API til Python - Eksempler

Du kan bruge PikePDF til at læse, skrive og opdatere metadataoplysninger for PDF-filer. API'en giver brugervenlige metoder og eksempler til at arbejde med PDF-filer fra dine Python-applikationer.

Læs metadataoplysninger om en fil ved hjælp af PikePDF API til Python

Det er nemt at læse metadataoplysninger fra PDF-fil ved hjælp af PikePDF-fil. Du kan bruge følgende eksempelkode til at læse metadataoplysningerne fra ethvert PDF-dokument.

Produktion

Når du udfører denne kode, vil outputtet minde noget om følgende:


PDF Metadata:
/Title: Sample PDF Document
/Author: John Doe
/Subject: Example Usage
/Producer: Adobe PDF Library
/CreationDate: D:20241226093000Z

Hvis ingen metadataoplysninger er tilgængelige i filen, vil outputtet være tomt.

Skriv metadataoplysninger til en PDF-fil ved hjælp af PikePDF API til Python

PikePDF kan skrive eller opdatere metadata af en PDF-fil. Biblioteket giver dig mulighed for at ændre eksisterende metadatafelter eller tilføje nye. Her er et eksempel, der viser, hvordan man opdaterer metadata i en PDF-fil:

Her er nogle almindelige standardfelter, du kan opdatere:


Title: The title of the document.
Author: The author of the document.
Subject: The subject or topic of the document.
Keywords: Keywords associated with the document for search purposes.
Creator: The application that created the document.
Producer: The software that generated the PDF.
CreationDate: The date the document was created.
ModDate: The date the document was last modified.

Konklusion for PikePDF API

PikePDF is a powerful and user-friendly Python library that simplifies the handling of PDF files, especially for metadata management. Built on the robust QPDF library, it offers seamless capabilities to read, write, and update metadata fields, enabling developers to organize, enrich, and customize PDF documents effectively. In addition to metadata operations, PikePDF excels at tasks like repairing corrupt PDFs, managing encryption, and converting files to PDF/A format, making it a versatile tool for a wide range of PDF-related workflows. Its open-source nature, active maintenance, and Pythonic API make it an excellent choice for developers looking for a reliable and efficient solution for PDF processing and metadata management. Whether you’re automating document workflows, ensuring compliance with archival standards, or enhancing PDF metadata for searchability, PikePDF provides the tools you need to work with PDFs effortlessly.