Open Source Python PDF Merger Library

Vyzkoušejte tuto uživatelsky přívětivou knihovnu Pythonu s otevřeným zdrojovým kódem, která vám umožňuje bez námahy rozdělovat, spojovat, otáčet, zaměňovat a mazat stránky, což z ní činí všestranný nástroj pro potřeby vašich dokumentů PDF.

Co je PyMuPDF?

PyMuPDF, také známý jako Fitz, je open-source Python knihovna, která poskytuje komplexní sadu nástrojů pro práci se soubory PDF. S PyMuPDF mohou uživatelé efektivně provádět úkoly, jako je otevírání souborů PDF, extrahování textu a obrázků, manipulace s vlastnostmi stránky, jako je otáčení a oříznutí, vytváření nových dokumentů PDF a převod stránek PDF na obrázky.

PyMuPDF podporuje několik funkcí. V této recenzi se však primárně zaměříme na funkce knihovny rozdělování, slučování a správu stránek PDF. Chcete-li hloubkové vyhodnocení možností extrakce a analýzy, klikněte sem.

Statistiky GitHubu

Název:
Jazyk:
hvězdy:
Vidlice:
Licence:
Úložiště bylo naposledy aktualizováno v

Začínáme s PyMuPDF

K instalaci a používání PyMuPDF potřebujete Python verze 3.8.0 nebo vyšší. Nejprve tedy nainstalujte Python a poté pomocí níže uvedených příkazů nainstalujte PyMuPDF na váš počítač pomocí pip a virtuální prostředí.

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

MacOS


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Windows


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf

Spojte více souborů PDF do jednoho

Pomocí knihovny PyMuPDF můžeme v Pythonu zkombinovat více PDF do jednoho souboru PDF. Následující úryvek kódu spojuje dva dokumenty PDF tak, že je jeden po druhém připojí a uloží jako nový dokument:

Rozdělit PDF do více souborů

Je také možné rozdělit dokument PDF do více souborů PDF v Pythonu pomocí knihovny PyMuPDF. Následující fragment kódu rozdělí první dvě stránky dokumentu a uloží je jako samostatné PDF:

Otočit stránky PDF

Můžeme také otáčet stránky souboru PDF pomocí knihovny PyMuPDF. K otočení stránek v níže uvedeném fragmentu kódu použijeme funkci set_rotation:

Výstup

Jak vidíme, dokument je otočen o 90 stupňů.

Smazat stránky PDF

PyMuPDF lze také použít k odstranění stránek souboru PDF. Ke smazání stránek použijeme funkci delete_page. Následuje dokument, který je vstupem a kód smaže jeho druhou stránku:

Výstup

Obrázek níže zobrazuje upravený soubor PDF, ze kterého byla odstraněna druhá stránka.

Závěr

PyMuPDF se může pochlubit pozoruhodnými přednostmi při slučování a manipulaci se stránkami v dokumentech PDF. Jeho flexibilita a efektivita při otáčení, ořezávání, změně velikosti a mazání stránek z něj činí robustní volbu pro úlohy úpravy PDF. Kromě toho je pozoruhodnou výhodou schopnost PyMuPDF hladce sloučit více dokumentů PDF.

Jeho relativně složité API však může představovat křivku učení pro nováčky a mohou existovat určitá omezení při práci s extrémně velkými nebo složitými PDF, což by mohlo ovlivnit výkon. Nicméně jeho rozsáhlé možnosti v těchto oblastech z něj dělají cenný nástroj pro ty, kteří hledají přesnou kontrolu nad obsahem PDF.

Podobné Produkty

pypdf | Knihovna Pythonu pro slučování a rozdělování PDF