1. 产品
  2.   元数据
  3.   Python
  4.   hachoir-metadata
 
  

开源 Python 元数据库

免费开源 Python 库,用于读取、编辑和更新文档的元数据。

Python 的 Hachoir-metadata API 是什么?

hachoir-metadata 是一个 Python 库,是更广泛的 Hachoir 项目的一部分,旨在解析和提取各种文件类型的元数据。它提供了读取元数据的工具,而无需解压缩或完全解码文件,使其轻量且高效地完成基本的元数据检查任务。

hachoir-metadata API 的功能

hachoir-metadata is a powerful API that has rich features as follow:
  • 文件类型支持:适用于多种文件格式,包括图像、视频、音频文件、档案和文档。
  • 元数据提取:提取基本元数据,例如文件大小、创建日期、修改日期以及更多特定于格式的属性(例如,图像的 EXIF、视频的编解码器等)。
  • 只读操作:专注于读取和检查元数据而不修改原始文件。
  • 文件类型无关:自动检测文件类型并相应地提取元数据。
  • 集成:可以集成到 Python 应用程序中,用于内容组织、数字取证和档案系统等工作流程。

hachoir-metadata API 模式

  • 经典模式:提取元数据,您可以使用 –level=LEVEL 来限制要显示的信息量(而不是提取的信息量)
  • type:在一行上显示文件格式和最重要的信息
  • mime:仅显示文件 MIME 类型

开始使用 Python 版 Hachoir API

GitHub

GitHub 统计

姓名:
语言:
星星:
叉子:
执照:
存储库上次更新于

为了使用 Python 的 Hachoir API,您需要在系统上安装 Python 3.6+ 版本和 Hachoir。因此,首先安装 Python,然后使用以下命令使用 pip虚拟环境 在您的机器上安装 Hachoir API。


pip install hachoir

Alternatively, you can also install hachoir from Github repository using the following steps:


1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]

使用 Python 的 hachoir-metadata API - 示例

Python 版 hachoir-metadata API 可让您从媒体文件类型中读取元数据信息。只需几行代码,您就可以开发功能强大的应用程序,从不同的文件格式中读取元数据信息。以下代码示例展示了如何在 Python 应用程序中使用 hachoir-metadata API。

使用 Python 的 hachoir-metadata API - 示例

pyExifTool 为您提供读取各种文件格式(如 PDF、BMP、JPEG、DOCX、XLSX 等)元数据的支持。API 允许您使用 get_metadata 方法读取文件的元数据信息。查看下面的代码片段,我们从 PDF 文件中读取元数据信息。

输出

当您执行此代码时,输出将与以下内容类似(取决于示例文件中可用的信息):


Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian

结论

hachoir-metadata API 提供了一种强大而轻量级的解决方案,用于从各种文件格式中提取元数据,使其成为从事数字取证、内容管理和数据分析等领域的 Python 开发人员的绝佳工具。它无需修改即可解析文件,确保数据完整性,而其 Pythonic 界面简化了与应用程序和工作流程的集成。hachoir-metadata 支持多种文件类型和元数据属性,是快速高效检查个人和专业项目/系统的多功能选择。

类似产品

 中国人