Biblioteca de metadados Python de código aberto para documentos PDF

Biblioteca Python gratuita e de código aberto para ler, editar e atualizar metadados de arquivos PDF.

O que é PikePDF para Python?

PikePDF é uma biblioteca Python moderna, adaptada para manipulação de PDF sem interrupções, com recursos poderosos para trabalhar especificamente com metadados. Construído na robusta biblioteca QPDF, o PikePDF permite que os desenvolvedores adicionem, editem e removam facilmente metadados de arquivos PDF, tornando-o uma ferramenta essencial para organizar e enriquecer informações de documentos. Se você precisa atualizar títulos, autores, campos de assunto ou entradas de metadados personalizadas, o PikePDF fornece uma API Pythonic e intuitiva para gerenciar esses detalhes programaticamente. Ele também oferece suporte ao manuseio de metadados incorporados para classificação e capacidade de pesquisa aprimoradas de documentos, garantindo a conformidade com fluxos de trabalho que dependem fortemente de descrições detalhadas de documentos. Com seu foco em confiabilidade e desempenho, o PikePDF é ideal para automatizar tarefas de gerenciamento de metadados em sistemas de processamento de documentos ou aprimorar fluxos de trabalho de PDF orientados a metadados.

Recursos da API PikePDF

PikePDF API for Python has rich set of features for working with the metadata of the PDF documents. Some of its features are as listed below.

Manipulação de PDF: mescle, divida, gire e reordene páginas em arquivos PDF.
Manipulação de metadados: adicione, edite ou remova metadados para melhorar a organização e as informações do PDF.
Criptografia e segurança: criptografe PDFs com senhas, desbloqueie PDFs protegidos e gerencie configurações de segurança.
Reparar arquivos corrompidos: detecte e corrija problemas em documentos PDF danificados ou corrompidos.
Conversão de PDF/A: converta PDFs para o formato PDF/A para arquivamento e conformidade de longo prazo.
Suporte a fontes incorporadas: manipule fontes incorporadas para consistência e compatibilidade de texto.
Orientado ao desempenho: otimizado para operações rápidas e confiáveis com PDFs grandes ou complexos.
Baseado em QPDF: aproveita a poderosa biblioteca QPDF para recursos avançados de manipulação de PDF.
Código aberto: gratuito e mantido ativamente pela comunidade de desenvolvedores.

Vantagens de usar a API PikePDF

Gerenciamento de metadados: adicione, edite ou remova metadados facilmente para melhorar a organização e a capacidade de pesquisa do PDF.
Suporte a PDF/A: converta PDFs em formatos de arquivo, preservando ou atualizando metadados.
Tratamento de corrupção: repare e restaure arquivos PDF danificados sem perder metadados.
Criptografia e segurança: gerencie a proteção por senha e a criptografia, mantendo a integridade dos metadados.
Metadados personalizados: adicione campos personalizados para adaptar metadados de PDF a fluxos de trabalho específicos ou requisitos comerciais.
Alto desempenho: otimizado para processamento rápido e eficiente de arquivos PDF grandes e complexos.
Código aberto: gratuito e mantido ativamente, oferecendo uma solução confiável e econômica.
Baseado em QPDF: aproveita os recursos poderosos do QPDF para operações avançadas de PDF e metadados.

Introdução à API PikePDF para Python

Estatísticas do GitHub

Nome:
Linguagem:
Estrelas:
Garfos:
Licença:
O repositório foi atualizado pela última vez em

Usar o PikePDF em seus aplicativos Python exigirá que você instale a versão 3.9+ do Python em seu sistema. Então, primeiro instale o Python e então use os comandos abaixo para instalar a API Hachoir em sua máquina usando pip e ambiente virtual.


pip install pikepdf

Trabalhando com PikePDF API para Python - Exemplos

Você pode usar o PikePDF para ler, escrever e atualizar informações de metadados de arquivos PDF. A API fornece métodos e amostras fáceis de usar para trabalhar com arquivos PDF de dentro de seus aplicativos Python.

Ler informações de metadados de um arquivo usando a API PikePDF para Python

Ler informações de metadados de um arquivo PDF usando o arquivo PikePDF é fácil. Você pode usar o seguinte código de exemplo para ler as informações de metadados de qualquer documento PDF.

Saída

Ao executar este código, a saída será semelhante à seguinte:


PDF Metadata:
/Title: Sample PDF Document
/Author: John Doe
/Subject: Example Usage
/Producer: Adobe PDF Library
/CreationDate: D:20241226093000Z

Se nenhuma informação de metadados estiver disponível no arquivo, a saída estará vazia.

Grave informações de metadados em um arquivo PDF usando a API PikePDF para Python

O PikePDF pode escrever ou atualizar metadados de um arquivo PDF. A biblioteca permite que você modifique campos de metadados existentes ou adicione novos. Aqui está um exemplo demonstrando como atualizar metadados em um arquivo PDF:

Aqui estão alguns campos padrão comuns que você pode atualizar:


Title: The title of the document.
Author: The author of the document.
Subject: The subject or topic of the document.
Keywords: Keywords associated with the document for search purposes.
Creator: The application that created the document.
Producer: The software that generated the PDF.
CreationDate: The date the document was created.
ModDate: The date the document was last modified.

Conclusão para a API PikePDF

PikePDF is a powerful and user-friendly Python library that simplifies the handling of PDF files, especially for metadata management. Built on the robust QPDF library, it offers seamless capabilities to read, write, and update metadata fields, enabling developers to organize, enrich, and customize PDF documents effectively. In addition to metadata operations, PikePDF excels at tasks like repairing corrupt PDFs, managing encryption, and converting files to PDF/A format, making it a versatile tool for a wide range of PDF-related workflows. Its open-source nature, active maintenance, and Pythonic API make it an excellent choice for developers looking for a reliable and efficient solution for PDF processing and metadata management. Whether you’re automating document workflows, ensuring compliance with archival standards, or enhancing PDF metadata for searchability, PikePDF provides the tools you need to work with PDFs effortlessly.