Atvirojo kodo Python PDF susijungimo biblioteka
Išbandykite šią patogią atvirojo kodo Python biblioteką, kuri leidžia be vargo skaidyti, sujungti, pasukti, sukeisti puslapius ir ištrinti puslapius, todėl tai yra universalus įrankis jūsų PDF dokumentų poreikiams tenkinti.
Kas yra PyMuPDF?
PyMuPDF, taip pat žinomas kaip Fitz, yra atvirojo kodo Python biblioteka, kurioje pateikiamas išsamus įrankių rinkinys darbui su PDF failais. Naudodami PyMuPDF, vartotojai gali efektyviai atlikti tokias užduotis kaip atidaryti PDF failus, išgauti tekstą ir vaizdus, manipuliuoti puslapio ypatybėmis, pvz., sukti ir apkarpyti, kurti naujus PDF dokumentus ir konvertuoti PDF puslapius į vaizdus.
PyMuPDF palaiko keletą funkcijų. Tačiau šioje apžvalgoje pagrindinis dėmesys bus skiriamas bibliotekos PDF skaidymo, sujungimo ir puslapių valdymo funkcijoms. Jei norite nuodugniai įvertinti išgavimo ir analizavimo galimybes, spustelėkite čia.
Darbo su PyMuPDF pradžia
Norint įdiegti ir naudoti PyMuPDF, reikalinga 3.8.0 ar naujesnė Python versija. Taigi pirmiausia įdiekite Python, tada naudokite toliau pateiktas komandas, kad įdiegtumėte PyMuPDF savo kompiuteryje naudodami pip ir virtuali aplinka.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Sujunkite kelis PDF failus į vieną
Naudodami PyMuPDF biblioteką galime sujungti kelis PDF failus į vieną PDF failą Python. Šis kodo fragmentas sujungia du PDF dokumentus, pridedant vieną po kito ir išsaugomas kaip naujas dokumentas:
Padalinkite PDF į kelis failus
Be to, naudojant PyMuPDF biblioteką, „Python“ galima padalyti PDF dokumentą į kelis PDF failus. Šis kodo fragmentas padalija pirmuosius du dokumento puslapius ir išsaugo juos kaip atskirą PDF:
Pasukti PDF puslapius
Taip pat galime pasukti PDF failo puslapius naudodami PyMuPDF biblioteką. Naudosime funkciją set_rotation, kad pasuktume puslapius toliau pateiktame kodo fragmente:
Kaip matome, dokumentas yra pasuktas 90 laipsnių kampu.
Ištrinkite PDF puslapius
PyMuPDF taip pat gali būti naudojamas PDF failo puslapiams ištrinti. Puslapiams ištrinti naudosime funkciją delete_page. Toliau pateikiamas dokumentas, kuris yra įvestis, o kodas ištrins antrąjį puslapį:
Žemiau esančiame paveikslėlyje rodomas pakeistas PDF failas, iš kurio buvo pašalintas antrasis puslapis.
Išvada
„PyMuPDF“ gali pasigirti nepaprastomis PDF dokumentų sujungimo ir manipuliavimo puslapiais pranašumais. Dėl lankstumo ir efektyvumo sukant, apkarpant, keičiant dydį ir šalinant puslapius, jis yra patikimas pasirinkimas atliekant PDF keitimo užduotis. Be to, PyMuPDF galimybė sklandžiai sujungti kelis PDF dokumentus yra didelis pranašumas.
Tačiau jos gana sudėtinga API gali būti mokymosi kreivė naujokams, be to, gali būti tam tikrų apribojimų tvarkant itin didelius ar sudėtingus PDF failus, o tai gali turėti įtakos našumui. Nepaisant to, dėl didelių galimybių šiose srityse jis yra vertingas įrankis tiems, kurie nori tiksliai valdyti PDF turinį.