1. 製品
  2.   合併
  3.   Python
  4.   PyMuPDF
 
  

オープンソースの Python PDF マージライブラリ

このユーザーフレンドリーなオープンソースの Python ライブラリを試してみてください。このライブラリを使用すると、ページを簡単に分割、結合、回転、交換、削除することができ、PDF ドキュメントのニーズに対応する多目的ツールになります。

PyMuPDF とは何ですか?

PyMuPDF (別名 Fitz) は、PDF ファイルの操作に必要な包括的なツール セットを提供するオープン ソースの Python ライブラリです。PyMuPDF を使用すると、PDF を開く、テキストや画像を抽出、回転や切り取りなどのページ プロパティを操作、新しい PDF ドキュメントを作成する、PDF ページを画像に変換するなどのタスクを効率的に実行できます。

PyMuPDF はいくつかの機能をサポートしています。ただし、このレビューでは、ライブラリの PDF 分割、結合、およびページ管理機能に主に焦点を当てます。抽出機能と解析機能の詳細な評価については、ここをクリックしてください。

GitHub

GitHub の統計

名前:
言語:
出演者:
フォーク:
ライセンス:
リポジトリの最終更新日時

PyMuPDF を使い始める

PyMuPDF をインストールして使用するには、Python バージョン 3.8.0 以上が必要です。まず Python をインストールし、次に以下のコマンドを使用して pip仮想環境 を使用して PyMuPDF をマシンにインストールします。

リナックス


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

MacOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

ウィンドウズ


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf 

複数のPDFを1つに結合する

PyMuPDF ライブラリを使用すると、Python で複数の PDF を 1 つの PDF ファイルに結合できます。次のコード スニペットは、2 つの PDF ドキュメントを次々に追加して結合し、新しいドキュメントとして保存します。

PDFを複数のファイルに分割する

PyMuPDF ライブラリを使用して、Python で PDF ドキュメントを複数の PDF に分割することもできます。次のコード スニペットは、ドキュメントの最初の 2 ページを分割し、別々の PDF として保存します。

PDFページを回転する

PyMuPDF ライブラリを使用して PDF ファイルのページを回転することもできます。以下のコード スニペットでは、set_rotation 関数を使用してページを回転します。

出力

ご覧のとおり、ドキュメントは 90 度回転しています。

PDFページを削除

PyMuPDF は PDF ファイルのページを削除するのにも使用できます。ページを削除するには、delete_page 関数を使用します。以下は入力となるドキュメントで、コードはその 2 ページ目を削除します。

出力

下の画像は、2 ページ目が削除された変更された PDF ファイルを示しています。

結論

PyMuPDF は、PDF ドキュメント内の結合とページ操作において優れた強みを誇ります。ページの回転、切り取り、サイズ変更、削除における柔軟性と効率性により、PDF 修正タスクに最適な選択肢となっています。さらに、複数の PDF ドキュメントをシームレスに結合する PyMuPDF の機能は、注目すべき利点です。

ただし、比較的複雑な API は初心者にとっては習得に時間がかかる可能性があり、非常に大きい PDF や複雑な PDF の処理には制限があり、パフォーマンスに影響する可能性があります。とはいえ、これらの領域での幅広い機能により、PDF コンテンツを正確に制御したい人にとっては貴重なツールになります。

類似製品

 日本語