Avoimen lähdekoodin Python PDF -fuusiokirjasto
Kokeile tätä käyttäjäystävällistä, avoimen lähdekoodin Python-kirjastoa, jonka avulla voit vaivattomasti jakaa, yhdistää, kiertää, vaihtaa ja poistaa sivuja, mikä tekee siitä monipuolisen työkalun PDF-dokumenttien tarpeisiin.
Mikä on PyMuPDF?
PyMuPDF, joka tunnetaan myös nimellä Fitz, on avoimen lähdekoodin Python-kirjasto, joka tarjoaa kattavan joukon työkaluja PDF-tiedostojen käsittelyyn. PyMuPDF:n avulla käyttäjät voivat tehokkaasti suorittaa tehtäviä, kuten avata PDF-tiedostoja, poimia tekstiä ja kuvia, manipuloida sivun ominaisuuksia, kuten kiertoa ja rajausta, luoda uusia PDF-dokumentteja ja muuntaa PDF-sivuja kuviksi.
PyMuPDF tukee useita ominaisuuksia. Tässä katsauksessa keskitymme kuitenkin ensisijaisesti kirjaston PDF-jako-, yhdistämis- ja sivunhallintaominaisuuksiin. Jos haluat perusteellisen arvion purkamis- ja jäsennysominaisuuksista, napsauta tätä.
PyMuPDF:n käytön aloittaminen
Tarvitset Python-version 3.8.0 tai uudemman PyMuPDF:n asentamiseen ja käyttämiseen. Joten asenna ensin Python ja asenna sitten PyMuPDF koneellesi alla olevien komentojen avulla käyttämällä pip ja virtuaaliympäristö.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Mac käyttöjärjestelmä
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Yhdistä useita PDF-tiedostoja yhdeksi
PyMuPDF-kirjaston avulla voimme yhdistää useita PDF-tiedostoja yhdeksi PDF-tiedostoksi Pythonissa. Seuraava koodinpätkä yhdistää kaksi PDF-dokumenttia lisäämällä peräkkäin ja tallentamalla sen uutena asiakirjana:
Jaa PDF useisiin tiedostoihin
Pythonissa on myös mahdollista jakaa PDF-dokumentti useiksi PDF-tiedostoiksi PyMuPDF-kirjaston avulla. Seuraava koodinpätkä jakaa asiakirjan kaksi ensimmäistä sivua ja tallentaa ne erillisenä PDF-tiedostona:
Kierrä PDF-sivuja
PyMuPDF-kirjaston avulla voimme myös kääntää PDF-tiedoston sivuja. Käytämme set_rotation-funktiota sivujen kiertämiseen alla olevassa koodinpätkässä:
Kuten näemme, asiakirjaa käännetään 90 astetta.
Poista PDF-sivut
PyMuPDF:ää voidaan käyttää myös PDF-tiedoston sivujen poistamiseen. Käytämme delete_page-toimintoa sivujen poistamiseen. Seuraava on asiakirja, joka syötetään ja koodi poistaa sen toisen sivun:
Alla olevassa kuvassa näkyy muokattu PDF-tiedosto, josta toinen sivu on poistettu.
Johtopäätös
PyMuPDF:llä on merkittäviä vahvuuksia PDF-dokumenttien yhdistämisessä ja sivujen käsittelyssä. Sen joustavuus ja tehokkuus sivujen kiertämisessä, rajaamisessa, koon muuttamisessa ja poistamisessa tekevät siitä vankan valinnan PDF-muokkaustehtäviin. Lisäksi PyMuPDF:n kyky yhdistää useita PDF-dokumentteja saumattomasti on huomattava etu.
Sen suhteellisen monimutkainen API voi kuitenkin tarjota oppimiskäyrän uusille tulokkaille, ja erittäin suurten tai monimutkaisten PDF-tiedostojen käsittelyssä saattaa olla rajoituksia, jotka voivat vaikuttaa suorituskykyyn. Siitä huolimatta sen laajat ominaisuudet näillä alueilla tekevät siitä arvokkaan työkalun niille, jotka haluavat hallita PDF-sisältöä tarkasti.