کتابخانه فراداده PDF پیتون منبع باز
کتابخانه رایگان و منبع باز Python برای خواندن و به روز رسانی ابرداده اسناد PDF.
pypdf چیست؟
Pypdf یک کتابخانه همه کاره python منبع باز است که به دلیل مجموعه ای از ویژگی های متنوع برای دستکاری PDF شناخته شده است. این کتابخانه برای دستکاری های مختلف PDF مانند تجزیه PDF و تجزیه و ادغام PDF مفید است. و غیره اما در این بررسی محصول، ما فقط بر روی ویژگی های مدیریت ابرداده PDF آن تمرکز خواهیم کرد.
ویژگی های اصلی pypdf مربوط به ابرداده در زیر آمده است:
- خواندن فراداده PDF: میتوانید ویژگیهای (مانند نویسنده، سازنده، سازنده، عنوان، موضوع و کلمات کلیدی) اسناد PDF را با استفاده از pypdf بخوانید.
- بهروزرسانی فراداده PDF: همچنین میتوانید ابرداده اسناد PDF را با استفاده از pypdf بهروزرسانی کنید.
شروع کار با pypdf
برای نصب و استفاده از pypdf به نسخه 3.6.0 یا بالاتر پایتون نیاز دارید. بنابراین، ابتدا Python را نصب کنید و سپس از دستورات زیر برای نصب pypdf بر روی دستگاه خود با استفاده از pip و محیط مجازی.
لینوکس
python3 -m venv venv
source venv/bin/activate
pip install pypdf
سیستم عامل مک
python -m venv venv
source venv/bin/activate
pip install pypdf
پنجره ها
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
خواندن متادیتا PDF
ما می توانیم ابرداده یک سند PDF را با استفاده از کتابخانه pypdf بخوانیم. ما متادیتای یک PDF را از ویژگی metadata کلاس PdfReader در کتابخانه pypdf دریافت خواهیم کرد. برای جزئیات، قطعه کد زیر را بررسی کنید:
خروجی
تصویر زیر متادیتای فایل PDF ارائه شده را نمایش می دهد:
به روز رسانی متادیتا PDF
همچنین میتوانیم ابردادههای یک سند PDF مانند نویسنده، سازنده، موضوع و عنوان و غیره را با استفاده از کتابخانه pypdf بهروزرسانی کنیم. ما یک شی حاوی اطلاعات فراداده را به روش add_metadata کلاس PdfWriter در کتابخانه pypdf ارسال می کنیم تا ابرداده سند PDF را به روز رسانی/نوشتن کنیم. برای جزئیات، قطعه کد زیر را بررسی کنید:
نتیجه
در نتیجه، pypdf ثابت می کند که یک کتابخانه استثنایی پایتون برای خواندن و به روز رسانی ابرداده اسناد PDF است. توسعه دهندگان به راحتی می توانند متادیتا اسناد PDF را بدون هیچ مشکلی بخوانند و به روز کنند.