Open Source Python PDF Merger Library
Vyzkoušejte tuto uživatelsky přívětivou knihovnu Pythonu s otevřeným zdrojovým kódem, která vám umožňuje bez námahy rozdělovat, spojovat, otáčet, zaměňovat a mazat stránky, což z ní činí všestranný nástroj pro potřeby vašich dokumentů PDF.
Co je PyMuPDF?
PyMuPDF, také známý jako Fitz, je open-source knihovna Pythonu, která poskytuje komplexní sadu nástrojů pro práci se soubory PDF. S PyMuPDF mohou uživatelé efektivně provádět úkoly, jako je otevírání souborů PDF, extrahování textu a obrázků, manipulace s vlastnostmi stránky, jako je otáčení a oříznutí, vytváření nových dokumentů PDF a převod stránek PDF na obrázky.
PyMuPDF podporuje několik funkcí. V této recenzi se však primárně zaměříme na funkce knihovny rozdělování, slučování a správu stránek PDF. Chcete-li hloubkové vyhodnocení možností extrakce a analýzy, klikněte sem.
Začínáme s PyMuPDF
K instalaci a používání PyMuPDF potřebujete Python verze 3.8.0 nebo vyšší. Nejprve tedy nainstalujte Python a poté pomocí níže uvedených příkazů nainstalujte PyMuPDF na váš počítač pomocí pip a virtuální prostředí.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Operační Systém Mac
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Okna
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Spojte více souborů PDF do jednoho
Pomocí knihovny PyMuPDF můžeme v Pythonu zkombinovat více PDF do jednoho souboru PDF. Následující úryvek kódu spojuje dva dokumenty PDF tak, že je jeden po druhém připojí a uloží jako nový dokument:
Rozdělit PDF do více souborů
V Pythonu je také možné rozdělit dokument PDF do více souborů PDF pomocí knihovny PyMuPDF. Následující fragment kódu rozdělí první dvě stránky dokumentu a uloží je jako samostatné PDF:
Otočit stránky PDF
Můžeme také otáčet stránky souboru PDF pomocí knihovny PyMuPDF. K otočení stránek v níže uvedeném fragmentu kódu použijeme funkci set_rotation:
Výstup
Jak vidíme, dokument je otočen o 90 stupňů.
Smazat stránky PDF
PyMuPDF lze také použít k odstranění stránek souboru PDF. Ke smazání stránek použijeme funkci delete_page. Následuje dokument, který je vstupem a kód smaže jeho druhou stránku:
Výstup
Obrázek níže zobrazuje upravený soubor PDF, ze kterého byla odstraněna druhá stránka.
Závěr
PyMuPDF se může pochlubit pozoruhodnými přednostmi při slučování a manipulaci se stránkami v dokumentech PDF. Jeho flexibilita a efektivita při otáčení, ořezávání, změně velikosti a mazání stránek z něj činí robustní volbu pro úlohy úpravy PDF. Kromě toho je pozoruhodnou výhodou schopnost PyMuPDF hladce sloučit více dokumentů PDF.
Jeho relativně složité API však může představovat křivku učení pro nováčky a mohou existovat určitá omezení při práci s extrémně velkými nebo složitými PDF, což by mohlo ovlivnit výkon. Nicméně jeho rozsáhlé možnosti v těchto oblastech z něj dělají cenný nástroj pro ty, kteří hledají přesnou kontrolu nad obsahem PDF.