オープンソースの Python HTML から PDF への変換ライブラリ
この無料のオープンソース Python ライブラリを試して、HTML を PDF ドキュメントに変換してください。
xhtml2pdfとは何ですか?
Xhtml2pdf は、元の構造とスタイルを維持することに主な焦点を当てて、HTML コンテンツを PDF ドキュメントに変換するために設計されたオープン ソースの Python ライブラリです。この強力なライブラリは、Web ページをプロ仕様の印刷可能な PDF にシームレスに変換します。
xhtml2pdf の入門
xhtml2pdf をインストールして使用するには、Python バージョン 3.8.0 以降が必要です。したがって、まず Python をインストールし、次に以下のコマンドを使用して、pip と 仮想環境あ>。
Linux
python -m venv env
. env/bin/activate
pip install xhtml2pdf
マックOS
python -m venv env
. env/bin/activate
pip install xhtml2pdf
ウィンドウズ
python -m venv env
.\env\Scripts\activate
pip install xhtml2pdf
HTML文字列をPDFドキュメントに変換する
xhtml2pdf ライブラリを使用して、HTML 文字列を PDF ドキュメントに変換できます。完全な HTML コンテンツを変数に保存し、その変数を関数 pisa.CreatePDF(html_content, dest, encoding) に渡します。このメソッドは、ハイパーリンク、画像、その他の要素が渡されたBytesIO オブジェクト内で管理される PDF コンテンツを提供します。最後に、BytesIO オブジェクトに保存されているデータを使用して PDF ファイルを作成します。詳細については、以下のコード スニペットを確認してください。
出力
以下のスクリーンショットは、HTML 文字列から変換された PDF ドキュメントを示しています。
HTML ファイルを PDF ドキュメントに変換する
xhtml2pdf ライブラリを使用して、HTML ファイルを PDF に変換することもできます。 HTML ファイルのコンテンツを変数に読み取り、その変数を pisa.CreatePDF(html_content, dest, encoding) メソッドに渡します。その後、前の例で共有したのと同じ手順に従い、以下のコード スニペットに示すように、BytesIO オブジェクトを使用して PDF ドキュメントを作成します。
出力
以下のスクリーンショットは、HTML ファイルから変換された PDF ドキュメントを示しています。
結論
要約すると、xhtml2pdf は、ハイパーリンク、画像、外部スタイルシートを処理しながら HTML を PDF ドキュメントに変換するオープンソースの Python ライブラリです。 xhtml2pdf には、HTML を PDF に変換する際のフロントエンド ライブラリが含まれていないため、HTML に {{name}} などの変数がある場合、実際の値を表示するのではなく、HTML に記述されたとおりに PDF に表示されます。
さらに、コンテンツを取得するために JavaScript に依存する動的ページのサポートが欠如しており、複雑な CSS 指定のレイアウトに従いません (たとえば、CSS に記載されている色、フォント サイズなどは適用されますが、レイアウト CSS は無視されます)。パディング、マージン、ディスプレイなど)。これらの制約にもかかわらず、xhtml2pdf は依然として静的な HTML から PDF への簡単な変換ニーズに対応する貴重なツールです。