Biblioteca de metadados Python de código aberto
Biblioteca Python gratuita e de código aberto para ler, editar e atualizar metadados de documentos.
O que é pyExifTool?
A biblioteca Python pyExifTool é um wrapper leve em torno do popular utilitário ExifTool, permitindo que os usuários interajam com metadados de arquivo programaticamente. Com suporte para vários formatos de arquivo, incluindo PDFs, imagens, vídeos e arquivos de áudio, o pyexiftool fornece a capacidade de ler, gravar e excluir metadados usando os recursos poderosos do ExifTool. A biblioteca foi projetada para alavancar os recursos de linha de comando do ExifTool, ao mesmo tempo em que oferece uma interface Pythonic para facilidade de uso. Nesta página, discutiremos como os desenvolvedores podem usar a API pyExifTool em seus aplicativos Python para trabalhar com metadados de arquivos.
Introdução ao pyExifTool
Para usar o pyExifTool, você precisa instalar o Python versão 3.6+ e o ExifTool no seu sistema. Então, primeiro instale o Python e então use os comandos abaixo para instalar o pyExifTool na sua máquina usando o pip e o ambiente virtual.
python -m pip install -U pyexiftool
1. Checkout the source code from Github repository git clone git://github.com/sylikc/pyexiftool.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Lendo metadados de PDF e outros arquivos
pyExifTool fornece suporte para leitura de metadados de uma variedade de formatos de arquivo, como PDF, BMP, JPEG, DOCX, XLSX e muitos outros. A API permite que você leia as informações de metadados de um arquivo usando o método get_metadata. Verifique o trecho de código abaixo, onde lemos as informações de metadados de um arquivo PDF.
Saída
A captura de tela abaixo exibe os metadados do arquivo PDF:
Atualizando metadados de PDF e outros formatos de arquivo
Você também pode atualizar os metadados de um PDF ou qualquer outro documento usando o pyExifTool. A ferramenta permite que você atualize os campos de metadados, como autor, produtor, assunto, título, etc., definindo as tags. Isso é mostrado no código de exemplo a seguir.
Conclusão
Concluindo, pyExifTool Python é uma biblioteca Python poderosa para ler e atualizar os metadados de diferentes tipos de documentos. Ela é baseada no ExifTool que suporta múltiplos formatos de arquivo para ler/escrever metadados. Desenvolvedores de aplicativos Python podem usá-la para desenvolver programas que podem ler e escrever metadados de um documento em passos fáceis.
Produtos Similares
- Biblioteca Mutagen Python - Gerencie Metadados de Áudio Sem Esforço
- Biblioteca Python PikePDF - Manipulação e segurança de PDF sem esforço
- Biblioteca Python PyMuPDF para metadados PDF | Código aberto
- hachoir | Biblioteca Python de código aberto para metadados de documentos
- OpenPyXL API - Gerencie metadados do Excel sem esforço