PyMuPDF

 
 

PDF Meta Verilerini Yönetmek İçin Açık Kaynaklı Python Kütüphanesi

PDF belgelerinin meta verilerine erişmek ve bunları değiştirmek için ücretsiz ve açık kaynaklı Python kütüphanesi olan PyMuPDF'i deneyin.

PyMuPDF nedir?

Fitz olarak da bilinen PyMuPDF, PDF'leri ayrıştırma, PDF'leri bölme ve birleştirme gibi birçok özellik sunan açık kaynaklı bir Python kütüphanesidir. Ancak bu sayfada yalnızca Python geliştiricilerinin PyMuPDF kütüphanesini kullanarak şu gibi PDF meta verileriyle ilgili görevleri nasıl gerçekleştirebileceklerini ele alacağız:

  • PDF Meta Verilerini Oku: PyMuPDF, yazar, başlık, konu ve oluşturulma tarihi gibi bilgileri içeren PDF belgelerinin meta verilerine erişmeyi destekler.
  • PDF Meta Verilerini Değiştir: Kütüphane ayrıca PDF belgelerinin meta verilerinin değiştirilmesine de olanak tanır.
  • XML Meta Verilerini Oku: PDF belgeleri ayrıca yazar, başlık vb. gibi standart belge özellikleriyle sınırlı olmayan ve ek meta verilere sahip olabilen XML meta verilerini de içerir. Geliştiriciler PyMuPDF ile bunu da okuyabilir.
  • XML Meta Verilerini Değiştir: Geliştiriciler ayrıca PyMuPDF kütüphanesini kullanarak PDF'lerin XML meta verilerini değiştirebilirler.
GitHub

GitHub İstatistikleri

İsim:
Dil:
Yıldızlar:
Çatallar:
Lisans:
Depo en son şu tarihte güncellendi:

PyMuPDF'e Başlarken

PyMuPDF'i kurmak ve kullanmak için Python 3.8.0 veya üzeri sürüme ihtiyacınız var. Bu nedenle, önce Python'u kurun ve ardından aşağıdaki komutları kullanarak PyMuPDF'i makinenize pip ve sanal ortam kullanarak kurun.

Linux


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Mac OS X


python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf

Pencereler


python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf  

PDF Meta Verilerini Oku

PyMuPDF kütüphanesinin metadata üyesini kullanarak bir PDF'in meta verilerini okuyabiliriz; bu üye, belgenin tüm meta veri içeriğini içerir. Aşağıdaki kod parçacığı, bir PDF'in meta verilerinin metadata üyesinden nasıl elde edileceğini gösterir:

Çıktı

Aşağıdaki ekran görüntüsü PyMuPDF kullanılarak bir PDF'den alınan meta verileri göstermektedir:

PDF Meta Verilerini Düzenle

Aşağıdaki kod parçacığında gösterildiği gibi, değiştirmek istediğimiz alanları ve bu alanların yeni değerlerini içeren bir sözlüğü set_metadata metoduna geçirerek PyMuPDF kütüphanesini kullanarak PDF'lerin meta verilerini düzenleyebiliriz:

PDF'lerin XML Meta Verilerini Oku

PyMuPDF kütüphanesini kullanarak bir PDF'in XML meta verilerini alabiliriz. Aşağıdaki kod parçacığında gösterildiği gibi tüm XML meta verilerini döndüren get_xml_metadata yöntemini kullanırız:

Çıktı

Aşağıdaki ekran görüntüsü, PyMuPDF kullanılarak bir PDF'den alınan XML meta verilerini göstermektedir:

PDF'lerin XML Meta Verilerini Değiştir

PyMuPDF kütüphanesinin set_xml_metadata metodunu kullanarak bir PDF'in XML meta verilerini ayarlayabilir veya değiştirebiliriz. Belge düzeyindeki meta verileri değiştirmek kadar basit değildir çünkü set_xml_metadata herhangi bir dizeyi kabul eder ve kendisine geçirilen dizeyle tüm XML meta verilerini değiştirir.

Herhangi bir meta veri bilgisinin istem dışı silinmesini önlemek için, önce get_xml_metadata kullanarak tam XML meta verisini bir dize olarak alırız ve sonra istenen bilgiyi değiştirmek için dizenin replace yöntemini kullanırız. Son olarak, değiştirilen alanlarla tam XML'i PDF'nin tüm XML meta verisini değiştiren set_xml_metadata yöntemine geçiririz. Ayrıntılar için aşağıdaki kod parçacığına bakın:

Çözüm

Özetle, PyMuPDF meta veri manipülasyonuyla ilgili görevler için harika bir araçtır. PDF'lerin meta veri bilgilerini kolayca alabilir ve değiştirebiliriz. Ancak, set_xml_metadata yönteminde dikkate değer bir zayıflık vardır. Bu yöntem, kendisine iletilen herhangi bir dizeyi kabul eder ve önceki XML'i üzerine yazar, bu da bu sorunu önlemek için istem dışı bilgi kaybına neden olabilir. Geliştiricilerin, XML meta verilerinde doğru değişiklikleri sağlamak için mantıklarını uygulamaları gerekir.

Benzer Ürünler

 Türkçe