1. 製品
  2.   合併
  3.   Python
  4.   PyMuPDF
 
  

オープンソースの Python PDF マージャー ライブラリ

このユーザーフレンドリーなオープンソース Python ライブラリを試してください。ページの分割、結合、回転、交換、削除を簡単に行うことができ、PDF ドキュメントのニーズに応える多用途のツールになります。

PyMuPDFとは何ですか?

Fitz としても知られる PyMuPDF は、PDF ファイルを操作するための包括的なツール セットを提供するオープンソース Python ライブラリです。 PyMuPDF を使用すると、ユーザーは PDF を開く、テキストと画像を抽出する、回転やトリミングなどのページ プロパティを操作する、新しい PDF ドキュメントを作成する、PDF ページを画像に変換するなどのタスクを効率的に実行できます。

PyMuPDF はいくつかの機能をサポートしています。ただし、このレビューでは、ライブラリの PDF 分割、結合、およびページ管理機能に主に焦点を当てます。抽出機能と解析機能の詳細な評価については、ここをクリックしてください。

GitHub

GitHub の統計

名前:
言語:
出演者:
フォーク:
ライセンス:
リポジトリの最終更新日時

PyMuPDF の入門

PyMuPDF をインストールして使用するには、Python バージョン 3.8.0 以降が必要です。したがって、まず Python をインストールし、次に以下のコマンドを使用して pip仮想環境あ>。

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

マックOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

ウィンドウズ


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

複数の PDF を 1 つに結合する

PyMuPDF ライブラリを使用すると、Python で複数の PDF を 1 つの PDF ファイルに結合できます。次のコード スニペットは、2 つの PDF ドキュメントを次々に追加して結合し、新しいドキュメントとして保存します。

PDFを複数のファイルに分割する

PyMuPDF ライブラリを使用して、Python で PDF ドキュメントを複数の PDF に分割することもできます。次のコード スニペットは、ドキュメントの最初の 2 ページを分割し、別の PDF として保存します。

PDF ページを回転する

PyMuPDF ライブラリを使用して PDF ファイルのページを回転することもできます。以下のコード スニペットでは、set_rotation 関数を使用してページを回転します。

出力

ご覧のとおり、ドキュメントは 90 度回転されています。

PDFページの削除

PyMuPDF は、PDF ファイルのページを削除するためにも使用できます。 delete_page 関数を使用してページを削除します。以下は入力となるドキュメントであり、コードはその 2 ページ目を削除します。

出力

下の画像は、2 ページ目が削除された、変更された PDF ファイルを示しています。

結論

PyMuPDF は、PDF ドキュメント内の結合とページ操作において顕著な強みを誇ります。ページの回転、切り抜き、サイズ変更、削除が柔軟かつ効率的に行えるため、PDF の変更タスクに強力な選択肢となります。さらに、複数の PDF ドキュメントをシームレスに結合できる PyMuPDF の機能も注目に値します。

ただし、API が比較的複雑であるため、初心者にとっては学習に時間がかかる可能性があり、非常に大きい PDF や複雑な PDF の処理には制限があり、パフォーマンスに影響を与える可能性があります。それにもかかわらず、これらの分野での広範な機能により、PDF コンテンツを正確に制御したい人にとっては貴重なツールになります。

類似製品

 日本語