Perpustakaan Penggabungan PDF Python Sumber Terbuka
Cobalah pustaka Python sumber terbuka yang mudah digunakan ini yang memungkinkan Anda membagi, menggabungkan, memutar, menukar, dan menghapus halaman dengan mudah, menjadikannya alat serbaguna untuk kebutuhan dokumen PDF Anda.
Apa itu PyMuPDF?
PyMuPDF, juga dikenal sebagai Fitz, adalah pustaka Python sumber terbuka yang menyediakan seperangkat alat lengkap untuk bekerja dengan file PDF. Dengan PyMuPDF, pengguna dapat melakukan tugas secara efisien seperti membuka PDF, mengekstrak teks dan gambar, memanipulasi properti halaman seperti memutar dan memotong, membuat dokumen PDF baru, dan mengonversi halaman PDF menjadi gambar.
PyMuPDF mendukung beberapa fitur. Namun, dalam ulasan ini fokus utama kami adalah pada fitur pemisahan, penggabungan, dan pengelolaan halaman PDF pada perpustakaan. Untuk evaluasi mendalam mengenai kemampuan ekstraksi dan penguraian, silakan klik di sini.
Memulai dengan PyMuPDF
Anda memerlukan Python versi 3.8.0 atau lebih tinggi untuk menginstal dan menggunakan PyMuPDF. Jadi, pertama-tama instal Python lalu gunakan perintah di bawah ini untuk menginstal PyMuPDF di mesin Anda menggunakan pip dan lingkungan virtual.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
macOS
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
jendela
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Gabungkan Banyak PDF menjadi Satu
Menggunakan perpustakaan PyMuPDF, kita dapat menggabungkan beberapa PDF menjadi satu file PDF dengan Python. Cuplikan kode berikut menggabungkan dua dokumen PDF dengan menambahkan satu demi satu dan menyimpannya sebagai dokumen baru:
Pisahkan PDF menjadi Beberapa File
Dimungkinkan juga untuk membagi dokumen PDF menjadi beberapa PDF dengan Python menggunakan perpustakaan PyMuPDF. Cuplikan kode berikut membagi dua halaman pertama dokumen dan menyimpannya sebagai PDF terpisah:
Putar Halaman PDF
Kami juga dapat memutar halaman file PDF menggunakan perpustakaan PyMuPDF. Kami akan menggunakan fungsi set_rotation untuk memutar halaman dalam cuplikan kode di bawah ini:
Keluaran
Seperti yang bisa kita lihat, dokumen diputar 90 derajat.
Hapus Halaman PDF
PyMuPDF juga dapat digunakan untuk menghapus halaman file PDF. Kami akan menggunakan fungsi delete_page untuk menghapus halaman. Berikut dokumen yang diinput dan kodenya akan menghapus halaman kedua:
Keluaran
Gambar di bawah menampilkan file PDF yang dimodifikasi, halaman kedua telah dihapus.
Kesimpulan
PyMuPDF menawarkan kekuatan luar biasa dalam penggabungan dan manipulasi halaman dalam dokumen PDF. Fleksibilitas dan efisiensinya dalam memutar, memotong, mengubah ukuran, dan menghapus halaman menjadikannya pilihan tepat untuk tugas modifikasi PDF. Selain itu, kemampuan PyMuPDF untuk menggabungkan beberapa dokumen PDF dengan lancar merupakan keuntungan penting.
Namun, API yang relatif kompleks mungkin memberikan kurva pembelajaran bagi pendatang baru, dan mungkin terdapat beberapa keterbatasan dalam menangani PDF yang sangat besar atau kompleks, yang dapat memengaruhi kinerja. Meskipun demikian, kemampuannya yang luas dalam bidang-bidang ini menjadikannya alat yang berharga bagi mereka yang mencari kontrol yang tepat atas konten PDF.