Perpustakaan Penggabungan PDF Python Sumber Terbuka
Cuba perpustakaan Python sumber terbuka yang mesra pengguna ini yang membolehkan anda membahagi, menyertai, memutar, menukar dan memadam halaman dengan mudah, menjadikannya alat serba boleh untuk keperluan dokumen PDF anda.
Apakah PyMuPDF?
PyMuPDF, juga dikenali sebagai Fitz, ialah perpustakaan Python sumber terbuka yang menyediakan set alat yang komprehensif untuk bekerja dengan fail PDF. Dengan PyMuPDF, pengguna boleh melaksanakan tugas dengan cekap seperti membuka PDF, mengekstrak teks dan imej, memanipulasi sifat halaman seperti putaran dan pemangkasan, mencipta dokumen PDF baharu dan menukar halaman PDF kepada imej.
PyMuPDF menyokong beberapa ciri. Walau bagaimanapun, dalam ulasan ini tumpuan utama kami adalah pada ciri pemisahan, penggabungan dan pengurusan halaman pustaka PDF. Untuk penilaian mendalam tentang keupayaan pengekstrakan dan penghuraian, sila klik di sini.
Bermula dengan PyMuPDF
Anda memerlukan Python versi 3.8.0 atau lebih tinggi untuk memasang dan menggunakan PyMuPDF. Jadi, mula-mula pasang Python dan kemudian gunakan arahan di bawah untuk memasang PyMuPDF pada mesin anda menggunakan pip dan persekitaran maya.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Windows
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Sertai Berbilang PDF menjadi Satu
Menggunakan perpustakaan PyMuPDF, kami boleh menggabungkan berbilang PDF ke dalam satu fail PDF dalam Python. Coretan kod berikut menggabungkan dua dokumen PDF bersama-sama dengan menambahkan satu demi satu dan menyimpannya sebagai dokumen baharu:
Pisahkan PDF kepada Berbilang Fail
Ia juga mungkin untuk memisahkan dokumen PDF kepada berbilang PDF dalam Python menggunakan perpustakaan PyMuPDF. Coretan kod berikut membahagikan dua halaman pertama dokumen dan menyimpannya sebagai PDF yang berasingan:
Putar Halaman PDF
Kami juga boleh memutar halaman fail PDF menggunakan perpustakaan PyMuPDF. Kami akan menggunakan fungsi set_rotation untuk memutarkan halaman dalam coretan kod di bawah:
Seperti yang kita lihat, dokumen itu diputar sebanyak 90 darjah.
Padamkan Halaman PDF
PyMuPDF juga boleh digunakan untuk memadam halaman fail PDF. Kami akan menggunakan fungsi delete_page untuk memadamkan halaman. Berikut ialah dokumen yang merupakan input dan kod tersebut akan memadamkan halaman kedua:
Imej di bawah memaparkan fail PDF yang diubah suai, dari mana halaman kedua telah dialih keluar.
Kesimpulan
PyMuPDF mempunyai kekuatan yang luar biasa dalam penggabungan dan manipulasi halaman dalam dokumen PDF. Fleksibiliti dan kecekapannya dalam memutar, memotong, mengubah saiz dan memadam halaman menjadikannya pilihan yang teguh untuk tugas pengubahsuaian PDF. Selain itu, keupayaan PyMuPDF untuk menggabungkan berbilang dokumen PDF dengan lancar adalah kelebihan yang ketara.
Walau bagaimanapun, APInya yang agak kompleks mungkin menunjukkan keluk pembelajaran untuk pendatang baharu, dan mungkin terdapat beberapa batasan dalam mengendalikan PDF yang sangat besar atau kompleks, yang boleh memberi kesan kepada prestasi. Namun begitu, keupayaannya yang luas dalam bidang ini menjadikannya alat yang berharga bagi mereka yang mencari kawalan tepat ke atas kandungan PDF.