Atvērtā pirmkoda Python PDF apvienošanas bibliotēka
Izmēģiniet šo lietotājam draudzīgo, atvērtā koda Python bibliotēku, kas ļauj bez piepūles sadalīt, apvienot, pagriezt, apmainīt un dzēst lapas, padarot to par daudzpusīgu rīku jūsu PDF dokumentu vajadzībām.
Kas ir PyMuPDF?
PyMuPDF, kas pazīstams arī kā Fitz, ir atvērtā pirmkoda Python bibliotēka, kas nodrošina visaptverošu rīku komplektu darbam ar PDF failiem. Izmantojot PyMuPDF, lietotāji var efektīvi veikt tādus uzdevumus kā PDF failu atvēršana, teksta un attēlu izvilkšana, manipulācijas ar lapas rekvizītiem, piemēram, pagriešana un apgriešana, jaunu PDF dokumentu izveide un PDF lappušu konvertēšana attēlos.
PyMuPDF atbalsta vairākas funkcijas. Tomēr šajā pārskatā mūsu galvenā uzmanība tiks pievērsta bibliotēkas PDF sadalīšanas, apvienošanas un lapu pārvaldības funkcijām. Lai iegūtu padziļinātu izvilkšanas un parsēšanas iespēju novērtējumu, lūdzu, noklikšķiniet šeit.
Darba sākšana ar PyMuPDF
Lai instalētu un izmantotu PyMuPDF, nepieciešama Python versija 3.8.0 vai jaunāka versija. Tāpēc vispirms instalējiet Python un pēc tam izmantojiet tālāk norādītās komandas, lai instalētu PyMuPDF savā datorā, izmantojot pip un virtuālā vide.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Apvienojiet vairākus PDF failus vienā
Izmantojot PyMuPDF bibliotēku, mēs varam apvienot vairākus PDF failus vienā PDF failā Python. Šis koda fragments savieno divus PDF dokumentus, pievienojot vienu pēc otra un saglabājot to kā jaunu dokumentu:
Sadaliet PDF vairākos failos
Izmantojot PyMuPDF bibliotēku, programmā Python ir iespējams arī sadalīt PDF dokumentu vairākos PDF failos. Šis koda fragments sadala dokumenta pirmās divas lapas un saglabā tās kā atsevišķu PDF failu:
Pagriezt PDF lapas
Mēs varam arī pagriezt PDF faila lapas, izmantojot PyMuPDF bibliotēku. Mēs izmantosim funkciju set_rotation, lai pagrieztu lapas tālāk norādītajā koda fragmentā.
Kā redzam, dokuments ir pagriezts par 90 grādiem.
Dzēst PDF lapas
PyMuPDF var izmantot arī PDF faila lapu dzēšanai. Lai dzēstu lapas, mēs izmantosim funkciju delete_page. Šis ir dokuments, kas tiek ievadīts, un kods izdzēsīs tā otro lapu:
Zemāk esošajā attēlā ir redzams pārveidotais PDF fails, no kura ir noņemta otrā lapa.
Secinājums
PyMuPDF lepojas ar ievērojamām priekšrocībām apvienošanā un lappušu manipulācijās PDF dokumentos. Tā elastība un efektivitāte, rotējot, apgriežot, mainot izmērus un dzēšot lapas, padara to par spēcīgu izvēli PDF modifikācijas uzdevumiem. Turklāt PyMuPDF spēja nemanāmi sapludināt vairākus PDF dokumentus ir ievērojama priekšrocība.
Tomēr tā salīdzinoši sarežģītā API var radīt mācīšanās līkni jaunpienācējiem, un var būt daži ierobežojumi, apstrādājot ārkārtīgi lielus vai sarežģītus PDF failus, kas var ietekmēt veiktspēju. Neskatoties uz to, tā plašās iespējas šajās jomās padara to par vērtīgu rīku tiem, kas vēlas precīzi kontrolēt PDF saturu.