オープンソース Python PDF メタデータ ライブラリ
PDF ドキュメントのメタデータを読み取り、更新するための無料のオープンソース Python ライブラリ。
pypdfとは何ですか?
Pypdf は、PDF 操作のためのさまざまな機能セットで知られる多用途のオープンソース Python ライブラリです。このライブラリは、PDF 解析 や PDF の分割と結合など、さまざまな PDF 操作に役立ちます。 などですが、この製品レビューでは、PDF メタデータ管理機能のみに焦点を当てます。
メタデータに関連する pypdf の主な機能は次のとおりです。
- PDF メタデータの読み取り: pypdf を使用して、PDF ドキュメントのプロパティ (作成者、作成者、プロデューサー、タイトル、件名、キーワードなど) を読み取ることができます。
- PDF メタデータの更新: pypdf を使用して PDF ドキュメントのメタデータを更新することもできます。
pypdf の入門
pypdf をインストールして使用するには、Python バージョン 3.6.0 以降が必要です。したがって、まず Python をインストールし、次に以下のコマンドを使用して、pip と 仮想環境あ>。
Linux
python3 -m venv venv
source venv/bin/activate
pip install pypdf
マックOS
python -m venv venv
source venv/bin/activate
pip install pypdf
ウィンドウズ
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
PDFのメタデータの読み取り
pypdf ライブラリを使用して PDF ドキュメントのメタデータを読み取ることができます。 PDF のメタデータは、pypdf ライブラリの PdfReader クラスの metadata プロパティから取得します。詳細については、以下のコード スニペットを確認してください。
出力
以下のスクリーンショットには、提供された PDF ファイルのメタデータが表示されます。
PDFのメタデータを更新する
pypdf ライブラリを使用して、作成者、プロデューサー、件名、タイトルなどの PDF ドキュメントのメタデータを更新することもできます。メタデータ情報を含むオブジェクトを pypdf ライブラリの PdfWriter クラスの add_metadata メソッドに渡して、PDF ドキュメントのメタデータを更新/書き込みます。詳細については、以下のコード スニペットを確認してください。
結論
結論として、pypdf は PDF ドキュメントのメタデータを読み取り、更新するための優れた Python ライブラリであることがわかります。開発者は、PDF ドキュメントのメタデータを問題なく簡単に読み取り、更新できます。