オープンソースの Python PDF マージャー ライブラリ
このユーザーフレンドリーなオープンソース Python ライブラリを試してください。ページの分割、結合、回転、交換、削除を簡単に行うことができ、PDF ドキュメントのニーズに応える多用途のツールになります。
PyMuPDFとは何ですか?
Fitz としても知られる PyMuPDF は、PDF ファイルを操作するための包括的なツール セットを提供するオープンソース Python ライブラリです。 PyMuPDF を使用すると、ユーザーは PDF を開く、テキストと画像を抽出する、回転やトリミングなどのページ プロパティを操作する、新しい PDF ドキュメントを作成する、PDF ページを画像に変換するなどのタスクを効率的に実行できます。
PyMuPDF はいくつかの機能をサポートしています。ただし、このレビューでは、ライブラリの PDF 分割、結合、およびページ管理機能に主に焦点を当てます。抽出機能と解析機能の詳細な評価については、ここをクリックしてください。
PyMuPDF の入門
PyMuPDF をインストールして使用するには、Python バージョン 3.8.0 以降が必要です。したがって、まず Python をインストールし、次に以下のコマンドを使用して pip と 仮想環境あ>。
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
マックOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
ウィンドウズ
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
複数の PDF を 1 つに結合する
PyMuPDF ライブラリを使用すると、Python で複数の PDF を 1 つの PDF ファイルに結合できます。次のコード スニペットは、2 つの PDF ドキュメントを次々に追加して結合し、新しいドキュメントとして保存します。
PDFを複数のファイルに分割する
PyMuPDF ライブラリを使用して、Python で PDF ドキュメントを複数の PDF に分割することもできます。次のコード スニペットは、ドキュメントの最初の 2 ページを分割し、別の PDF として保存します。
PDF ページを回転する
PyMuPDF ライブラリを使用して PDF ファイルのページを回転することもできます。以下のコード スニペットでは、set_rotation 関数を使用してページを回転します。
出力
ご覧のとおり、ドキュメントは 90 度回転されています。
PDFページの削除
PyMuPDF は、PDF ファイルのページを削除するためにも使用できます。 delete_page 関数を使用してページを削除します。以下は入力となるドキュメントであり、コードはその 2 ページ目を削除します。
出力
下の画像は、2 ページ目が削除された、変更された PDF ファイルを示しています。
結論
PyMuPDF は、PDF ドキュメント内の結合とページ操作において顕著な強みを誇ります。ページの回転、切り抜き、サイズ変更、削除が柔軟かつ効率的に行えるため、PDF の変更タスクに強力な選択肢となります。さらに、複数の PDF ドキュメントをシームレスに結合できる PyMuPDF の機能も注目に値します。
ただし、API が比較的複雑であるため、初心者にとっては学習に時間がかかる可能性があり、非常に大きい PDF や複雑な PDF の処理には制限があり、パフォーマンスに影響を与える可能性があります。それにもかかわらず、これらの分野での広範な機能により、PDF コンテンツを正確に制御したい人にとっては貴重なツールになります。