Açık Kaynak Python PDF Birleştirme Kütüphanesi
Sayfaları zahmetsizce bölmenize, birleştirmenize, döndürmenize, değiştirmenize ve silmenize olanak tanıyan, PDF belge ihtiyaçlarınız için çok yönlü bir araç olan bu kullanıcı dostu, açık kaynaklı Python kütüphanesini deneyin.
PyMuPDF nedir?
Fitz olarak da bilinen PyMuPDF, PDF dosyalarıyla çalışmak için kapsamlı bir araç seti sağlayan açık kaynaklı bir Python kütüphanesidir. Kullanıcılar PyMuPDF ile PDF'leri açma, metin ve görselleri çıkarma, döndürme ve kırpma gibi sayfa özelliklerini düzenleme, yeni PDF belgeleri oluşturma ve PDF sayfalarını görsellere dönüştürme gibi görevleri verimli bir şekilde gerçekleştirebilir.
PyMuPDF birçok özelliği destekler. Ancak bu incelemede birincil odak noktamız kütüphanenin PDF bölme, birleştirme ve sayfa yönetimi özellikleri olacaktır. Çıkarma ve ayrıştırma yeteneklerinin derinlemesine bir değerlendirmesi için lütfen buraya tıklayın.
GitHub İstatistikleri
İsim: PyMuPDFDil: Python
Yıldızlar: 6.5K
Çatallar: 570
Lisans: GNU Affero General Public License v3.0
Depo en son şu tarihte güncellendi: 2025-02-19
PyMuPDF'e Başlarken
PyMuPDF'i kurmak ve kullanmak için Python 3.8.0 veya üzeri sürüme ihtiyacınız var. Bu nedenle, önce Python'u kurun ve ardından aşağıdaki komutları kullanarak PyMuPDF'i makinenize pip ve sanal ortam kullanarak kurun.
Linux
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Mac OS X
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
Pencereler
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
Birden Fazla PDF'yi Birleştirin
PyMuPDF kütüphanesini kullanarak, Python'da birden fazla PDF'yi tek bir PDF dosyasında birleştirebiliriz. Aşağıdaki kod parçası, iki PDF belgesini birbiri ardına ekleyerek birleştirir ve yeni bir belge olarak kaydeder:
# Import PyMuPDF | |
import fitz | |
# Open first document | |
doc1 = fitz.open("documentprocessing.pdf") | |
# Open second document | |
doc2 = fitz.open("data.pdf") | |
# Append document 2 after document 1 | |
doc1.insert_pdf(doc2) | |
# Save the new combined document | |
doc1.save("joined-doc1-and-doc2.pdf") |
PDF'yi Birden Fazla Dosyaya Böl
Ayrıca, PyMuPDF kütüphanesini kullanarak Python'da bir PDF belgesini birden fazla PDF'ye bölmek de mümkündür. Aşağıdaki kod parçacığı bir belgenin ilk iki sayfasını böler ve bunları ayrı bir PDF olarak depolar:
# Import PyMuPDF | |
import fitz | |
# Open the first PDF document | |
doc1 = fitz.open("joined-doc1-and-doc2.pdf") | |
# Create a new empty PDF document | |
doc2 = fitz.open() | |
# Insert the first 2 pages of doc1 into doc2 | |
doc2.insert_pdf(doc1, to_page=1) | |
# Save the modified document as "first-and-last-10.pdf" | |
doc2.save("prev-doc1.pdf") |
PDF Sayfalarını Döndür
PyMuPDF kütüphanesini kullanarak bir PDF dosyasının sayfalarını da döndürebiliriz. Aşağıdaki kod parçacığında sayfaları döndürmek için set_rotation fonksiyonunu kullanacağız:
# Import PyMuPDF | |
import fitz | |
# Open a PDF file | |
doc = fitz.open("documentprocessing.pdf") | |
# Rotate the first page clockwise by 90 degrees | |
first_page = doc[0] | |
first_page.set_rotation(90) | |
# Save the modified PDF to a new file | |
output_file = "modified.pdf" | |
doc.save(output_file) | |
# Close the PDF document | |
doc.close() |
Çıktı
Görüldüğü gibi belge 90 derece döndürülmüş durumda.
PDF Sayfalarını Sil
PyMuPDF ayrıca bir PDF dosyasının sayfalarını silmek için de kullanılabilir. Sayfaları silmek için delete_page fonksiyonunu kullanacağız. Aşağıda girdi olan belge ve ikinci sayfasını silecek kod bulunmaktadır:
# Import PyMuPDF | |
import fitz | |
# Open a PDF file | |
doc = fitz.open("documentprocessing.pdf") | |
# Delete the second page | |
doc.delete_page(1) | |
# Save the modified PDF to a new file | |
output_file = "modified.pdf" | |
doc.save(output_file) | |
# Close the PDF document | |
doc.close() |
Çıktı
Aşağıdaki görüntü, ikinci sayfası çıkarılmış olan değiştirilmiş PDF dosyasını göstermektedir.
Çözüm
PyMuPDF, PDF belgelerinde birleştirme ve sayfa düzenleme konusunda dikkate değer güçlü yönlere sahiptir. Sayfaları döndürme, kırpma, yeniden boyutlandırma ve silmedeki esnekliği ve verimliliği, onu PDF düzenleme görevleri için sağlam bir seçenek haline getirir. Ayrıca, PyMuPDF'nin birden fazla PDF belgesini sorunsuz bir şekilde birleştirme yeteneği dikkate değer bir avantajdır.
Ancak, nispeten karmaşık API'si yeni başlayanlar için bir öğrenme eğrisi sunabilir ve aşırı büyük veya karmaşık PDF'leri işlemede bazı sınırlamalar olabilir, bu da performansı etkileyebilir. Yine de, bu alanlardaki kapsamlı yetenekleri onu PDF içeriği üzerinde hassas kontrol arayanlar için değerli bir araç haline getirir.