کتابخانه فراداده PDF Python منبع باز

کتابخانه رایگان و منبع باز Python برای خواندن و به روز رسانی ابرداده اسناد PDF.

pypdf چیست؟

Pypdf یک کتابخانه همه کاره python منبع باز است که به دلیل مجموعه ای از ویژگی های متنوع برای دستکاری PDF شناخته شده است. این کتابخانه برای دستکاری های مختلف PDF مانند تجزیه PDF و تقسیم و ادغام PDF مفید است. و غیره اما در این بررسی محصول، ما فقط بر روی ویژگی های مدیریت ابرداده PDF آن تمرکز خواهیم کرد.

ویژگی های اصلی pypdf مربوط به ابرداده در زیر آمده است:

  • خواندن فراداده PDF: می‌توانید ویژگی‌های (مانند نویسنده، سازنده، سازنده، عنوان، موضوع و کلمات کلیدی) اسناد PDF را با استفاده از pypdf بخوانید.
  • به‌روزرسانی فراداده PDF: همچنین می‌توانید ابرداده اسناد PDF را با استفاده از pypdf به‌روزرسانی کنید.
GitHub

آمار GitHub

نام:
زبان:
ستاره ها:
چنگال:
مجوز:
آخرین به روز رسانی مخزن در

شروع کار با pypdf

برای نصب و استفاده از pypdf به نسخه 3.6.0 یا بالاتر پایتون نیاز دارید. بنابراین، ابتدا Python را نصب کنید و سپس از دستورات زیر برای نصب pypdf بر روی دستگاه خود با استفاده از pip و محیط مجازی.

خواندن فراداده PDF

ما می‌توانیم ابرداده یک سند PDF را با استفاده از کتابخانه pypdf بخوانیم. ما متادیتای یک PDF را از ویژگی metadata کلاس PdfReader در کتابخانه pypdf دریافت خواهیم کرد. برای جزئیات، قطعه کد زیر را بررسی کنید:

خروجی

تصویر زیر متادیتای فایل PDF ارائه شده را نمایش می دهد:

به روز رسانی متادیتا PDF

همچنین می‌توانیم ابرداده یک سند PDF مانند نویسنده، سازنده، موضوع و عنوان و غیره را با استفاده از کتابخانه pypdf به‌روزرسانی کنیم. ما یک شی حاوی اطلاعات فراداده را به روش add_metadata کلاس PdfWriter در کتابخانه pypdf ارسال می کنیم تا ابرداده سند PDF را به روز رسانی/نوشتن کنیم. برای جزئیات، قطعه کد زیر را بررسی کنید:

نتیجه گیری

در نتیجه، pypdf ثابت می کند که یک کتابخانه استثنایی پایتون برای خواندن و به روز رسانی ابرداده اسناد PDF است. توسعه دهندگان به راحتی می توانند متادیتا اسناد PDF را بدون هیچ مشکلی بخوانند و به روز کنند.

محصولات مشابه

 فارسی