オープンソースの Python メタデータ ライブラリ
ドキュメントのメタデータを読み取り、編集、更新するための無料のオープンソース Python ライブラリ。
Python 用の Hachoir メタデータ API とは何ですか?
hachoir-metadata は、幅広い Hachoir プロジェクト の一部である Python ライブラリで、さまざまなファイル タイプからメタデータを解析および抽出するために設計されています。ファイルを解凍したり完全にデコードしたりすることなくメタデータを読み取るツールを提供するため、基本的なメタデータ検査タスクを軽量かつ効率的に実行できます。
hachoir-metadata APIの機能
hachoir-metadata is a powerful API that has rich features as follow:- ファイルタイプのサポート: 画像、ビデオ、オーディオファイル、アーカイブ、ドキュメントなど、多くのファイル形式に対応しています。
- メタデータの抽出: ファイル サイズ、作成日、変更日、その他の形式固有のプロパティ (画像の EXIF、ビデオのコーデックなど) などの基本的なメタデータを抽出します。
- 読み取り専用操作: 元のファイルを変更せずにメタデータの読み取りと検査に重点を置きます。
- ファイル タイプに依存しない: ファイル タイプを自動的に検出し、それに応じてメタデータを抽出します。
- 統合: コンテンツ整理、デジタルフォレンジック、アーカイブシステムなどのワークフローで使用するために Python アプリケーションに統合できます。
hachoir-metadata API のモード
- クラシック モード: メタデータを抽出します。–level=LEVEL を使用して、表示する (抽出しない) 情報量を制限できます。
- type: ファイル形式と最も重要な情報を1行で表示します
- mime: ファイルのMIMEタイプのみを表示する
Python 用 Hachoir API を使い始める
Python 用の Hachoir API を使用するには、Python 3.6 以降のバージョンと Hachoir をシステムにインストールする必要があります。まず Python をインストールし、次に以下のコマンドを使用して pip と 仮想環境 を使用してマシンに Hachoir API をインストールします。
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
Python の hachoir-metadata API の使用 - 例
Python 用の hachoir-metadata API を使用すると、メディア ファイル タイプからメタデータ情報を読み取ることができます。わずか数行のコードで、さまざまなファイル形式からメタデータ情報を読み取ることができる強力なアプリケーションを開発できます。次のコード サンプルは、Python アプリケーションで hachoir-metadata API を使用する方法を示しています。
Python の hachoir-metadata API の使用 - 例
pyExifTool は、PDF、BMP、JPEG、DOCX、XLSX など、さまざまなファイル形式のメタデータの読み取りをサポートします。API を使用すると、get_metadata メソッドを使用してファイルのメタデータ情報を読み取ることができます。PDF ファイルからメタデータ情報を読み取る以下のコード スニペットを確認してください。
出力
このコードを実行すると、出力は次のようになります (サンプル ファイルで使用可能な情報によって異なります)。
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
結論
hachoir-metadata API は、さまざまなファイル形式からメタデータを抽出するための強力かつ軽量なソリューションを提供し、デジタルフォレンジック、コンテンツ管理、データ分析などの分野で働く Python 開発者にとって優れたツールとなっています。変更なしでファイルを解析できるため、データの整合性が確保され、Python インターフェースによりアプリケーションやワークフローへの統合が簡素化されます。多様なファイルタイプとメタデータプロパティをサポートしている hachoir-metadata は、個人用と業務用の両方のプロジェクト/システムで迅速かつ効率的にメタデータを検査するための多目的な選択肢です。