Biblioteca de metadados PDF Python de código aberto
Biblioteca Python gratuita e de código aberto para ler e atualizar metadados de documentos PDF.
O que é pypdf?
Pypdf é uma biblioteca python versátil de código aberto conhecida por seu conjunto diversificado de recursos para manipulação de PDF. Esta biblioteca é útil para várias manipulações de PDF, como análise de PDF e divisão e mesclagem de PDF etc., mas nesta análise do produto, focaremos apenas em seus recursos de gerenciamento de metadados de PDF.
A seguir estão os principais recursos do pypdf relacionados aos metadados:
- Ler metadados de PDF: você pode ler propriedades (como autor, criador, produtor, título, assunto e palavras-chave) de documentos PDF usando o pypdf.
- Atualizar metadados de PDF: você também pode atualizar metadados de documentos PDF usando o pypdf.
Introdução ao pypdf
Você precisa do Python versão 3.6.0 ou superior para instalar e usar o pypdf. Então, primeiro instale o Python e então use os comandos abaixo para instalar o pypdf na sua máquina usando pip e ambiente virtual.
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
Mac OS
python -m venv venv
source venv/bin/activate
pip install pypdf
Windows
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
Lendo metadados de PDF
Podemos ler os metadados de um documento PDF usando a biblioteca pypdf. Obteremos os metadados de um PDF da propriedade metadata da classe PdfReader na biblioteca pypdf. Verifique o trecho de código abaixo para obter detalhes:
Saída
A captura de tela abaixo exibe os metadados do arquivo PDF fornecido:
Atualizando Metadados de PDF
Também podemos atualizar metadados de um documento PDF, como autor, produtor, assunto e título, etc. usando a biblioteca pypdf. Passaremos um objeto contendo as informações de metadados para o método add_metadata da classe PdfWriter na biblioteca pypdf para atualizar/escrever metadados do documento PDF. Para detalhes, verifique o trecho de código abaixo:
Conclusão
Concluindo, pypdf prova ser uma biblioteca Python excepcional para ler e atualizar metadados de documentos PDF. Desenvolvedores podem facilmente ler e atualizar metadados de documentos PDF sem problemas.
Produtos Similares
- Biblioteca Mutagen Python - Gerencie Metadados de Áudio Sem Esforço
- Biblioteca Python PikePDF - Manipulação e segurança de PDF sem esforço
- Biblioteca Python PyMuPDF para metadados PDF | Código aberto
- hachoir | Biblioteca Python de código aberto para metadados de documentos
- OpenPyXL API - Gerencie metadados do Excel sem esforço