Biblioteca de metadados PDF Python de código aberto

Biblioteca Python gratuita e de código aberto para ler e atualizar metadados de documentos PDF.

O que é pypdf?

Pypdf é uma biblioteca python versátil de código aberto conhecida por seu conjunto diversificado de recursos para manipulação de PDF. Esta biblioteca é útil para várias manipulações de PDF, como análise de PDF e divisão e mesclagem de PDF etc., mas nesta análise do produto, focaremos apenas em seus recursos de gerenciamento de metadados de PDF.

A seguir estão os principais recursos do pypdf relacionados aos metadados:

  • Ler metadados de PDF: você pode ler propriedades (como autor, criador, produtor, título, assunto e palavras-chave) de documentos PDF usando o pypdf.
  • Atualizar metadados de PDF: você também pode atualizar metadados de documentos PDF usando o pypdf.
GitHub

Estatísticas do GitHub

Nome:
Linguagem:
Estrelas:
Garfos:
Licença:
O repositório foi atualizado pela última vez em

Introdução ao pypdf

Você precisa do Python versão 3.6.0 ou superior para instalar e usar o pypdf. Então, primeiro instale o Python e então use os comandos abaixo para instalar o pypdf na sua máquina usando pip e ambiente virtual.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

Mac OS


python -m venv venv
source venv/bin/activate
pip install pypdf

Windows


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

Lendo metadados de PDF

Podemos ler os metadados de um documento PDF usando a biblioteca pypdf. Obteremos os metadados de um PDF da propriedade metadata da classe PdfReader na biblioteca pypdf. Verifique o trecho de código abaixo para obter detalhes:

Saída

A captura de tela abaixo exibe os metadados do arquivo PDF fornecido:

Atualizando Metadados de PDF

Também podemos atualizar metadados de um documento PDF, como autor, produtor, assunto e título, etc. usando a biblioteca pypdf. Passaremos um objeto contendo as informações de metadados para o método add_metadata da classe PdfWriter na biblioteca pypdf para atualizar/escrever metadados do documento PDF. Para detalhes, verifique o trecho de código abaixo:

Conclusão

Concluindo, pypdf prova ser uma biblioteca Python excepcional para ler e atualizar metadados de documentos PDF. Desenvolvedores podem facilmente ler e atualizar metadados de documentos PDF sem problemas.

Produtos Similares

 Portugese