オープンソースの Python PDF マージライブラリ
PDF ドキュメントのページを分割、結合、追加、回転、切り取るための無料のオープンソース Python ライブラリ。
pypdfとは何ですか?
pypdf は、PDF ファイルのページの追加、回転、切り取り、分割、結合など、PDF ドキュメントに対するさまざまな操作を可能にする無料のオープンソース Python ライブラリです。
機能の一部を以下に示します。
- PDF の結合: pypdf を使用して、複数の PDF ドキュメントを 1 つの PDF ファイルに結合できます。これは、PDF レポート、プレゼンテーション、またはその他のドキュメントを組み合わせる場合に便利です。
- PDF の分割: Pypdf は、PDF を複数の小さな PDF に分割することもサポートしています。これは、大きな PDF を個別のセクションに分割したい場合に便利です。
- ページの回転: pypdf を使用して、PDF ドキュメント内の個々のページを回転できます。これは、スキャンしたドキュメントや画像の向きを修正するのに便利です。
pypdf を使い始める
pypdf をインストールして使用するには、Python バージョン 3.6.0 以上が必要です。まず Python をインストールし、次に以下のコマンドを使用して pip と 仮想環境 を使用してマシンに pypdf をインストールします。
リナックス
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
ウィンドウズ
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
PDFページの追加、回転、切り取り
Python の pypdf ライブラリを使用すると、次のコードに示すように、PdfWriter クラスと PdfReader クラスを使用して、ページの追加、回転、切り取り、さらには PDF ドキュメントへの JavaScript アクションの追加など、PDF ファイルを操作できます。
注意: コンテンツが見えなくなったからといって、消えたわけではありません。切り取りはビューボックスを調整することで機能します。つまり、切り取られたコンテンツは復元できます。
PDF ファイルを結合する
Python の pypdf ライブラリを使用すると、複数の PDF を 1 つのドキュメントに結合するなど、PDF ファイルを操作できます。以下のコードに示すように、PdfWriter クラスの関数を使用して、PDF ファイルを結合および操作できます。
PDF文書を分割
pypdf ライブラリの PdfWriter クラスと PdfReader クラスのさまざまな関数を使用して、PDF ドキュメントを複数のドキュメントに分割できます。以下のコード スニペットは、提供された PDF ドキュメントを 2 つに分割し、2 つの個別の PDF ファイルとして保存します。
結論
結論として、pypdf のマージ機能は模範的で、ライブラリが PDF ドキュメントの処理に優れていることを示しています。PDF を簡単に結合できる pypdf の機能は、ドキュメントの組み立て、レポートの生成、またはさまざまな PDF リソースの統合を必要とするタスクに最適です。ユーザーフレンドリーな機能と効率的なマージ機能により、PDF ドキュメント管理における貴重なツールとしての評判が高まっています。