Biblioteca de metadados Python de código aberto para documentos PDF
Biblioteca Python gratuita e de código aberto para ler, editar e atualizar metadados de arquivos PDF.
O que é PikePDF para Python?
PikePDF é uma biblioteca Python moderna, adaptada para manipulação de PDF sem interrupções, com recursos poderosos para trabalhar especificamente com metadados. Construído na robusta biblioteca QPDF, o PikePDF permite que os desenvolvedores adicionem, editem e removam facilmente metadados de arquivos PDF, tornando-o uma ferramenta essencial para organizar e enriquecer informações de documentos. Se você precisa atualizar títulos, autores, campos de assunto ou entradas de metadados personalizadas, o PikePDF fornece uma API Pythonic e intuitiva para gerenciar esses detalhes programaticamente. Ele também oferece suporte ao manuseio de metadados incorporados para classificação e capacidade de pesquisa aprimoradas de documentos, garantindo a conformidade com fluxos de trabalho que dependem fortemente de descrições detalhadas de documentos. Com seu foco em confiabilidade e desempenho, o PikePDF é ideal para automatizar tarefas de gerenciamento de metadados em sistemas de processamento de documentos ou aprimorar fluxos de trabalho de PDF orientados a metadados.
Recursos da API PikePDF
PikePDF API for Python has rich set of features for working with the metadata of the PDF documents. Some of its features are as listed below.- Manipulação de PDF: mescle, divida, gire e reordene páginas em arquivos PDF.
- Manipulação de metadados: adicione, edite ou remova metadados para melhorar a organização e as informações do PDF.
- Criptografia e segurança: criptografe PDFs com senhas, desbloqueie PDFs protegidos e gerencie configurações de segurança.
- Reparar arquivos corrompidos: detecte e corrija problemas em documentos PDF danificados ou corrompidos.
- Conversão de PDF/A: converta PDFs para o formato PDF/A para arquivamento e conformidade de longo prazo.
- Suporte a fontes incorporadas: manipule fontes incorporadas para consistência e compatibilidade de texto.
- Orientado ao desempenho: otimizado para operações rápidas e confiáveis com PDFs grandes ou complexos.
- Baseado em QPDF: aproveita a poderosa biblioteca QPDF para recursos avançados de manipulação de PDF.
- Código aberto: gratuito e mantido ativamente pela comunidade de desenvolvedores.
Vantagens de usar a API PikePDF
- Gerenciamento de metadados: adicione, edite ou remova metadados facilmente para melhorar a organização e a capacidade de pesquisa do PDF.
- Suporte a PDF/A: converta PDFs em formatos de arquivo, preservando ou atualizando metadados.
- Tratamento de corrupção: repare e restaure arquivos PDF danificados sem perder metadados.
- Criptografia e segurança: gerencie a proteção por senha e a criptografia, mantendo a integridade dos metadados.
- Metadados personalizados: adicione campos personalizados para adaptar metadados de PDF a fluxos de trabalho específicos ou requisitos comerciais.
- Alto desempenho: otimizado para processamento rápido e eficiente de arquivos PDF grandes e complexos.
- Código aberto: gratuito e mantido ativamente, oferecendo uma solução confiável e econômica.
- Baseado em QPDF: aproveita os recursos poderosos do QPDF para operações avançadas de PDF e metadados.
Introdução à API PikePDF para Python
Usar o PikePDF em seus aplicativos Python exigirá que você instale a versão 3.9+ do Python em seu sistema. Então, primeiro instale o Python e então use os comandos abaixo para instalar a API Hachoir em sua máquina usando pip e ambiente virtual.
pip install pikepdf
Trabalhando com PikePDF API para Python - Exemplos
Você pode usar o PikePDF para ler, escrever e atualizar informações de metadados de arquivos PDF. A API fornece métodos e amostras fáceis de usar para trabalhar com arquivos PDF de dentro de seus aplicativos Python.
Ler informações de metadados de um arquivo usando a API PikePDF para Python
Ler informações de metadados de um arquivo PDF usando o arquivo PikePDF é fácil. Você pode usar o seguinte código de exemplo para ler as informações de metadados de qualquer documento PDF.
Saída
Ao executar este código, a saída será semelhante à seguinte:
PDF Metadata:
/Title: Sample PDF Document
/Author: John Doe
/Subject: Example Usage
/Producer: Adobe PDF Library
/CreationDate: D:20241226093000Z
Se nenhuma informação de metadados estiver disponível no arquivo, a saída estará vazia.
Grave informações de metadados em um arquivo PDF usando a API PikePDF para Python
O PikePDF pode escrever ou atualizar metadados de um arquivo PDF. A biblioteca permite que você modifique campos de metadados existentes ou adicione novos. Aqui está um exemplo demonstrando como atualizar metadados em um arquivo PDF:
Aqui estão alguns campos padrão comuns que você pode atualizar:
Title: The title of the document.
Author: The author of the document.
Subject: The subject or topic of the document.
Keywords: Keywords associated with the document for search purposes.
Creator: The application that created the document.
Producer: The software that generated the PDF.
CreationDate: The date the document was created.
ModDate: The date the document was last modified.