Pustaka Penggabungan PDF Python Sumber Terbuka
Cobalah pustaka Python sumber terbuka yang mudah digunakan ini yang memungkinkan Anda membagi, menggabungkan, memutar, menukar, dan menghapus halaman dengan mudah, menjadikannya alat serbaguna untuk kebutuhan dokumen PDF Anda.
Apa itu PyMuPDF?
PyMuPDF, yang juga dikenal sebagai Fitz, adalah pustaka Python sumber terbuka yang menyediakan seperangkat alat lengkap untuk bekerja dengan berkas PDF. Dengan PyMuPDF, pengguna dapat secara efisien melakukan tugas-tugas seperti membuka PDF, mengekstrak teks dan gambar, memanipulasi properti halaman seperti rotasi dan pemotongan, membuat dokumen PDF baru, dan mengonversi halaman PDF menjadi gambar.
PyMuPDF mendukung beberapa fitur. Namun, dalam ulasan ini fokus utama kami adalah pada fitur pemisahan, penggabungan, dan pengelolaan halaman PDF dari pustaka tersebut. Untuk evaluasi mendalam tentang kemampuan ekstraksi dan penguraian, silakan klik di sini.
Memulai dengan PyMuPDF
Anda memerlukan Python versi 3.8.0 atau yang lebih tinggi untuk menginstal dan menggunakan PyMuPDF. Jadi, pertama-tama instal Python lalu gunakan perintah di bawah ini untuk menginstal PyMuPDF di komputer Anda menggunakan pip dan lingkungan virtual.
Bahasa Indonesia: Sistem Operasi Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Bahasa Indonesia: MacOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Jendela
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Gabungkan Beberapa PDF Menjadi Satu
Dengan menggunakan pustaka PyMuPDF, kita dapat menggabungkan beberapa PDF menjadi satu berkas PDF dengan Python. Potongan kode berikut menggabungkan dua dokumen PDF dengan menambahkan satu demi satu dan menyimpannya sebagai dokumen baru:
Membagi PDF menjadi Beberapa File
Anda juga dapat membagi dokumen PDF menjadi beberapa PDF di Python menggunakan pustaka PyMuPDF. Potongan kode berikut membagi dua halaman pertama dokumen dan menyimpannya sebagai PDF terpisah:
Putar Halaman PDF
Kita juga dapat memutar halaman file PDF menggunakan pustaka PyMuPDF. Kita akan menggunakan fungsi set_rotation untuk memutar halaman dalam cuplikan kode di bawah ini:
Keluaran
Seperti yang dapat kita lihat, dokumen diputar 90 derajat.
Hapus Halaman PDF
PyMuPDF juga dapat digunakan untuk menghapus halaman dari berkas PDF. Kita akan menggunakan fungsi delete_page untuk menghapus halaman. Berikut adalah dokumen yang menjadi input dan kode akan menghapus halaman keduanya:
Keluaran
Gambar di bawah menampilkan berkas PDF yang dimodifikasi, yang halaman kedua telah dihapus.
Kesimpulan
PyMuPDF menawarkan keunggulan luar biasa dalam penggabungan dan manipulasi halaman dalam dokumen PDF. Fleksibilitas dan efisiensinya dalam memutar, memotong, mengubah ukuran, dan menghapus halaman menjadikannya pilihan yang tangguh untuk tugas modifikasi PDF. Selain itu, kemampuan PyMuPDF untuk menggabungkan beberapa dokumen PDF dengan lancar merupakan keunggulan yang penting.
Namun, API-nya yang relatif kompleks dapat menjadi tantangan bagi pemula, dan mungkin ada beberapa keterbatasan dalam menangani PDF yang sangat besar atau kompleks, yang dapat memengaruhi kinerja. Meskipun demikian, kemampuannya yang luas di area ini menjadikannya alat yang berharga bagi mereka yang menginginkan kontrol yang tepat atas konten PDF.