开源 Python 元数据库
免费开源 Python 库,用于读取、编辑和更新文档的元数据。
什么是 pyExifTool?
pyExifTool Python 库是流行的 ExifTool 实用程序的轻量级包装器,使用户能够以编程方式与文件元数据交互。pyexiftool 支持各种文件格式,包括 PDF、图像、视频和音频文件,能够使用 ExifTool 的强大功能读取、写入和删除元数据。该库旨在利用 ExifTool 的命令行功能,同时提供易于使用的 Pythonic 界面。在本页中,我们将讨论开发人员如何在 Python 应用程序中使用 pyExifTool API 来处理文件的元数据。
pyExifTool 入门
为了使用 pyExifTool,您需要在系统上安装 Python 3.6+ 版本和 ExifTool。因此,首先安装 Python,然后使用以下命令通过 pip 和 虚拟环境 在您的机器上安装 pyExifTool。
python -m pip install -U pyexiftool
1. Checkout the source code from Github repository git clone git://github.com/sylikc/pyexiftool.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
读取 PDF 和其他文件的元数据
pyExifTool 为您提供读取各种文件格式(如 PDF、BMP、JPEG、DOCX、XLSX 等)元数据的支持。API 允许您使用 get_metadata 方法读取文件的元数据信息。查看下面的代码片段,我们从 PDF 文件中读取元数据信息。
输出
下面的截图显示了 PDF 文件的元数据:
更新 PDF 和其他文件格式的元数据
您还可以使用 pyExifTool 更新 PDF 或任何其他文档的元数据。该工具允许您通过设置标签来更新元数据字段,例如作者、制作人、主题、标题等。如以下示例代码所示。
结论
总之,pyExifTool Python 是一个功能强大的 Python 库,用于读取和更新不同类型文档的元数据。它基于 ExifTool,支持多种文件格式来读取/写入元数据。Python 应用程序开发人员可以使用它来开发能够以简单的步骤读取和写入文档元数据的程序。