Nyílt forráskódú Python PDF összevonási könyvtár
Próbálja ki ezt a felhasználóbarát, nyílt forráskódú Python-könyvtárat, amely lehetővé teszi az oldalak egyszerű felosztását, összekapcsolását, forgatását, cseréjét és törlését, így sokoldalú eszköz a PDF-dokumentumok igényeihez.
Mi az a PyMuPDF?
A PyMuPDF, más néven Fitz, egy nyílt forráskódú Python-könyvtár, amely átfogó eszközkészletet biztosít a PDF-fájlokkal való munkavégzéshez. A PyMuPDF segítségével a felhasználók hatékonyan hajthatnak végre olyan feladatokat, mint például a PDF-ek megnyitása, szövegek és képek kinyerése, az oldaltulajdonságok, például az elforgatás és a vágás, az új PDF-dokumentumok létrehozása és a PDF-oldalak képekké alakítása.
A PyMuPDF számos funkciót támogat. Ebben az áttekintésben azonban elsősorban a könyvtár PDF felosztására, egyesítésére és oldalkezelési funkcióira összpontosítunk. A kinyerési és elemzési képességek mélyreható értékeléséhez kattintson ide.
A PyMuPDF használatának első lépései
A PyMuPDF telepítéséhez és használatához a Python 3.8.0-s vagy újabb verziója szükséges. Tehát először telepítse a Pythont, majd az alábbi parancsok segítségével telepítse a PyMuPDF-et a gépére a pip és virtuális környezet a>.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Mac operációs rendszer
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
ablakok
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Egyesítsen több PDF-fájlt egybe
A PyMuPDF könyvtár használatával több PDF-t is kombinálhatunk egyetlen PDF-fájlba a Pythonban. A következő kódrészlet két PDF-dokumentumot kapcsol össze úgy, hogy egymás után hozzáfűzi, és új dokumentumként menti:
PDF felosztása több fájlra
A PyMuPDF könyvtár használatával egy PDF-dokumentum több PDF-fájlra is felosztható a Pythonban. A következő kódrészlet felosztja a dokumentum első két oldalát, és külön PDF-ként tárolja őket:
PDF-oldalak forgatása
A PyMuPDF könyvtár használatával egy PDF-fájl oldalait is elforgathatjuk. A set_rotation függvényt használjuk az oldalak elforgatásához az alábbi kódrészletben:
Amint látjuk, a dokumentum 90 fokkal el van forgatva.
PDF-oldalak törlése
A PyMuPDF PDF-fájlok oldalainak törlésére is használható. Az oldalak törléséhez a delete_page funkciót fogjuk használni. A következő a dokumentum, amely a bemenet, és a kód törli a második oldalát:
Az alábbi képen a módosított PDF fájl látható, amelyből a második oldalt eltávolították.
Következtetés
A PyMuPDF figyelemre méltó erősségekkel büszkélkedhet a PDF dokumentumokon belüli összevonás és oldalkezelés terén. Rugalmassága és hatékonysága az oldalak forgatásakor, kivágásában, átméretezésében és törlésében robusztus választássá teszi a PDF-módosítási feladatokhoz. Emellett a PyMuPDF azon képessége, hogy több PDF-dokumentumot zökkenőmentesen egyesít, jelentős előnyt jelent.
Viszonylag összetett API-ja azonban tanulási görbét jelenthet az újoncok számára, és előfordulhatnak bizonyos korlátozások a rendkívül nagy vagy összetett PDF-ek kezelésében, amelyek befolyásolhatják a teljesítményt. Mindazonáltal széleskörű képességei ezeken a területeken értékes eszközzé teszik azok számára, akik pontos ellenőrzést keresnek a PDF-tartalom felett.