オープンソースの Python PDF メタデータ ライブラリ
PDF ドキュメントのメタデータを読み取り、更新するための無料のオープンソース Python ライブラリ。
pypdfとは何ですか?
Pypdf は、PDF 操作のための多様な機能で知られる、多用途のオープン ソース Python ライブラリです。このライブラリは、PDF 解析 や PDF の分割と結合 など、さまざまな PDF 操作に便利ですが、この製品レビューでは、PDF メタデータ管理機能にのみ焦点を当てます。
メタデータに関連する pypdf の主な機能は次のとおりです。
- PDF メタデータの読み取り: pypdf を使用して、PDF ドキュメントのプロパティ (作成者、作成者、プロデューサー、タイトル、件名、キーワードなど) を読み取ることができます。
- PDF メタデータの更新: pypdf を使用して PDF ドキュメントのメタデータを更新することもできます。
pypdf を使い始める
pypdf をインストールして使用するには、Python バージョン 3.6.0 以上が必要です。まず Python をインストールし、次に以下のコマンドを使用して pip と 仮想環境 を使用してマシンに pypdf をインストールします。
リナックス
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
ウィンドウズ
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
PDFのメタデータの読み取り
pypdf ライブラリを使用して PDF ドキュメントのメタデータを読み取ることができます。pypdf ライブラリの PdfReader クラスの metadata プロパティから PDF のメタデータを取得します。詳細については、以下のコード スニペットを確認してください。
出力
以下のスクリーンショットは、提供された PDF ファイルのメタデータを示しています。
PDFのメタデータの更新
pypdf ライブラリを使用して、著者、プロデューサー、件名、タイトルなどの PDF ドキュメントのメタデータを更新することもできます。pypdf ライブラリの PdfWriter クラスの add_metadata メソッドにメタデータ情報を含むオブジェクトを渡して、PDF ドキュメントのメタデータを更新/書き込みます。詳細については、以下のコード スニペットを確認してください。
結論
結論として、pypdf は PDF ドキュメントのメタデータの読み取りと更新に優れた Python ライブラリであることがわかります。開発者は問題なく PDF ドキュメントのメタデータを簡単に読み取り、更新できます。