Açık Kaynak Python PDF Meta Veri Kütüphanesi

PDF belgelerinin meta verilerini okumak ve güncellemek için ücretsiz ve açık kaynaklı Python kütüphanesi.

Pypdf nedir?

Pypdf, PDF düzenleme için çeşitli özellikleriyle bilinen çok yönlü bir açık kaynaklı python kütüphanesidir. Bu kütüphane, PDF ayrıştırma ve PDF bölme ve birleştirme gibi çeşitli PDF düzenlemeleri için kullanışlıdır ancak bu ürün incelemesinde yalnızca PDF meta veri yönetimi özelliklerine odaklanacağız.

Aşağıda pypdf'nin meta verilerle ilgili temel özellikleri yer almaktadır:

  • PDF Meta Verilerini Oku: Pypdf kullanarak PDF belgelerinin özelliklerini (yazar, oluşturucu, yapımcı, başlık, konu ve anahtar sözcükler gibi) okuyabilirsiniz.
  • PDF Meta Verilerini Güncelle: Ayrıca pypdf kullanarak PDF belgelerinin meta verilerini de güncelleyebilirsiniz.
GitHub

GitHub İstatistikleri

İsim:
Dil:
Yıldızlar:
Çatallar:
Lisans:
Depo en son şu tarihte güncellendi:

pypdf ile Başlarken

Pypdf'yi kurmak ve kullanmak için Python 3.6.0 veya üzeri sürüme ihtiyacınız var. Bu nedenle, önce Python'u kurun ve ardından aşağıdaki komutları kullanarak pip ve sanal ortam kullanarak pypdf'yi makinenize kurun.

Linux


python3 -m venv venv
source venv/bin/activate
pip install pypdf

Mac OS X


python -m venv venv
source venv/bin/activate
pip install pypdf

Pencereler


python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf

PDF'nin Meta Verilerini Okuma

Bir PDF belgesinin meta verilerini pypdf kütüphanesini kullanarak okuyabiliriz. Bir PDF'nin meta verilerini pypdf kütüphanesindeki PdfReader sınıfının metadata özelliğinden alacağız. Ayrıntılar için aşağıdaki kod parçacığını inceleyin:

# Import PdfReader module from the pypdf library
from pypdf import PdfReader
# Create a PdfReader object and load the input PDF file
reader = PdfReader("meta-pdf.pdf")
# Reading metadata
meta = reader.metadata
# Print the metadata
print(meta.author)
print(meta.producer)
print(meta.subject)
print(meta.title)

Çıktı

Aşağıdaki ekran görüntüsü sağlanan PDF dosyasının meta verilerini göstermektedir:

PDF'nin Meta Verilerini Güncelleme

Yazar, yapımcı, konu ve başlık gibi bir PDF belgesinin meta verilerini de pypdf kütüphanesini kullanarak güncelleyebiliriz. PDF belgesinin meta verilerini güncellemek/yazmak için pypdf kütüphanesindeki PdfWriter sınıfının add_metadata metoduna meta veri bilgilerini içeren bir nesne geçireceğiz. Ayrıntılı bilgi için aşağıdaki kod parçacığını inceleyin:

# Import PdfReader and PdfWriter modules from the pypdf library
from pypdf import PdfReader, PdfWriter
# Import the datetime module
from datetime import datetime
# Create a PdfReader object and load the input PDF file
reader = PdfReader("documentprocessing.pdf")
# Creating a new PDF writer object using PdfWriter
writer = PdfWriter()
# Adding all pages from the input PDF to the new writer
for page in reader.pages:
writer.add_page(page)
# Format the current date and time for the metadata
# UTC time offset (optional, adjust as needed)
utc_time = "-05'00'"
# Current date and time formatted for metadata
time = datetime.now().strftime(f"D\072%Y%m%d%H%M%S{utc_time}")
# Writing new metadata to the PDF
writer.add_metadata(
{
"/Author": "Documentprocessing", # Author information
"/Producer": "Microsoft Word", # Software used to produce the PDF
"/Title": "Title", # Document title
"/Subject": "Subject", # Document subject
"/Keywords": "Keywords", # Keywords associated with the document
"/CreationDate": time, # Date and time the document was created
"/ModDate": time, # Date and time the document was last modified
"/Creator": "Creator", # Application that created the original document
}
)
# Save the new PDF to a file
with open("meta-pdf.pdf", "wb") as f:
writer.write(f)

Çözüm

Sonuç olarak, pypdf, PDF belgelerinin meta verilerini okumak ve güncellemek için olağanüstü bir Python kütüphanesi olduğunu kanıtlıyor. Geliştiriciler, PDF belgelerinin meta verilerini herhangi bir sorun yaşamadan kolayca okuyabilir ve güncelleyebilir.

Benzer Ürünler

 Türkçe