オープンソース Python PDF メタデータ ライブラリ

PDF ドキュメントのメタデータを読み取り、更新するための無料のオープンソース Python ライブラリ。

pypdfとは何ですか?

Pypdf は、PDF 操作のためのさまざまな機能セットで知られる多用途のオープンソース Python ライブラリです。このライブラリは、PDF 解析PDF の分割と結合など、さまざまな PDF 操作に役立ちます。 などですが、この製品レビューでは、PDF メタデータ管理機能のみに焦点を当てます。

メタデータに関連する pypdf の主な機能は次のとおりです。

  • PDF メタデータの読み取り: pypdf を使用して、PDF ドキュメントのプロパティ (作成者、作成者、プロデューサー、タイトル、件名、キーワードなど) を読み取ることができます。
  • PDF メタデータの更新: pypdf を使用して PDF ドキュメントのメタデータを更新することもできます。
GitHub

GitHub の統計

名前:
言語:
出演者:
フォーク:
ライセンス:
リポジトリの最終更新日時

pypdf の入門

pypdf をインストールして使用するには、Python バージョン 3.6.0 以降が必要です。したがって、まず Python をインストールし、次に以下のコマンドを使用して、pip仮想環境あ>。

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

マックOS


python -m venv venv
source venv/bin/activate
pip install pypdf

ウィンドウズ


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

PDFのメタデータの読み取り

pypdf ライブラリを使用して PDF ドキュメントのメタデータを読み取ることができます。 PDF のメタデータは、pypdf ライブラリの PdfReader クラスの metadata プロパティから取得します。詳細については、以下のコード スニペットを確認してください。

出力

以下のスクリーンショットには、提供された PDF ファイルのメタデータが表示されます。

PDFのメタデータを更新する

pypdf ライブラリを使用して、作成者、プロデューサー、件名、タイトルなどの PDF ドキュメントのメタデータを更新することもできます。メタデータ情報を含むオブジェクトを pypdf ライブラリの PdfWriter クラスの add_metadata メソッドに渡して、PDF ドキュメントのメタデータを更新/書き込みます。詳細については、以下のコード スニペットを確認してください。

結論

結論として、pypdf は PDF ドキュメントのメタデータを読み取り、更新するための優れた Python ライブラリであることがわかります。開発者は、PDF ドキュメントのメタデータを問題なく簡単に読み取り、更新できます。

類似製品

 日本語