オープンソースの Python PDF マージライブラリ
このユーザーフレンドリーなオープンソースの Python ライブラリを試してみてください。このライブラリを使用すると、ページを簡単に分割、結合、回転、交換、削除することができ、PDF ドキュメントのニーズに対応する多目的ツールになります。
PyMuPDF とは何ですか?
PyMuPDF (別名 Fitz) は、PDF ファイルの操作に必要な包括的なツール セットを提供するオープン ソースの Python ライブラリです。PyMuPDF を使用すると、PDF を開く、テキストや画像を抽出、回転や切り取りなどのページ プロパティを操作、新しい PDF ドキュメントを作成する、PDF ページを画像に変換するなどのタスクを効率的に実行できます。
PyMuPDF はいくつかの機能をサポートしています。ただし、このレビューでは、ライブラリの PDF 分割、結合、およびページ管理機能に主に焦点を当てます。抽出機能と解析機能の詳細な評価については、ここをクリックしてください。
PyMuPDF を使い始める
PyMuPDF をインストールして使用するには、Python バージョン 3.8.0 以上が必要です。まず Python をインストールし、次に以下のコマンドを使用して pip と 仮想環境 を使用して PyMuPDF をマシンにインストールします。
リナックス
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
ウィンドウズ
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
複数のPDFを1つに結合する
PyMuPDF ライブラリを使用すると、Python で複数の PDF を 1 つの PDF ファイルに結合できます。次のコード スニペットは、2 つの PDF ドキュメントを次々に追加して結合し、新しいドキュメントとして保存します。
PDFを複数のファイルに分割する
PyMuPDF ライブラリを使用して、Python で PDF ドキュメントを複数の PDF に分割することもできます。次のコード スニペットは、ドキュメントの最初の 2 ページを分割し、別々の PDF として保存します。
PDFページを回転する
PyMuPDF ライブラリを使用して PDF ファイルのページを回転することもできます。以下のコード スニペットでは、set_rotation 関数を使用してページを回転します。
出力
ご覧のとおり、ドキュメントは 90 度回転しています。
PDFページを削除
PyMuPDF は PDF ファイルのページを削除するのにも使用できます。ページを削除するには、delete_page 関数を使用します。以下は入力となるドキュメントで、コードはその 2 ページ目を削除します。
出力
下の画像は、2 ページ目が削除された変更された PDF ファイルを示しています。
結論
PyMuPDF は、PDF ドキュメント内の結合とページ操作において優れた強みを誇ります。ページの回転、切り取り、サイズ変更、削除における柔軟性と効率性により、PDF 修正タスクに最適な選択肢となっています。さらに、複数の PDF ドキュメントをシームレスに結合する PyMuPDF の機能は、注目すべき利点です。
ただし、比較的複雑な API は初心者にとっては習得に時間がかかる可能性があり、非常に大きい PDF や複雑な PDF の処理には制限があり、パフォーマンスに影響する可能性があります。とはいえ、これらの領域での幅広い機能により、PDF コンテンツを正確に制御したい人にとっては貴重なツールになります。