کتابخانه فراداده PDF Python منبع باز
کتابخانه رایگان و منبع باز Python برای خواندن و به روز رسانی ابرداده اسناد PDF.
pypdf چیست؟
Pypdf یک کتابخانه همه کاره python منبع باز است که به دلیل مجموعه ای از ویژگی های متنوع برای دستکاری PDF شناخته شده است. این کتابخانه برای دستکاری های مختلف PDF مانند تجزیه PDF و تقسیم و ادغام PDF مفید است. و غیره اما در این بررسی محصول، ما فقط بر روی ویژگی های مدیریت ابرداده PDF آن تمرکز خواهیم کرد.
ویژگی های اصلی pypdf مربوط به ابرداده در زیر آمده است:
- خواندن فراداده PDF: میتوانید ویژگیهای (مانند نویسنده، سازنده، سازنده، عنوان، موضوع و کلمات کلیدی) اسناد PDF را با استفاده از pypdf بخوانید.
- بهروزرسانی فراداده PDF: همچنین میتوانید ابرداده اسناد PDF را با استفاده از pypdf بهروزرسانی کنید.
شروع کار با pypdf
برای نصب و استفاده از pypdf به نسخه 3.6.0 یا بالاتر پایتون نیاز دارید. بنابراین، ابتدا Python را نصب کنید و سپس از دستورات زیر برای نصب pypdf بر روی دستگاه خود با استفاده از pip و محیط مجازی.
لینوکس
python3 -m venv venv
source venv/bin/activate
pip install pypdf
MacOS
python -m venv venv
source venv/bin/activate
pip install pypdf
ویندوز
python3 -m venv venv
venv\Scripts\activate.bat
pip install pypdf
خواندن فراداده PDF
ما میتوانیم ابرداده یک سند PDF را با استفاده از کتابخانه pypdf بخوانیم. ما متادیتای یک PDF را از ویژگی metadata کلاس PdfReader در کتابخانه pypdf دریافت خواهیم کرد. برای جزئیات، قطعه کد زیر را بررسی کنید:
خروجی
تصویر زیر متادیتای فایل PDF ارائه شده را نمایش می دهد:
به روز رسانی متادیتا PDF
همچنین میتوانیم ابرداده یک سند PDF مانند نویسنده، سازنده، موضوع و عنوان و غیره را با استفاده از کتابخانه pypdf بهروزرسانی کنیم. ما یک شی حاوی اطلاعات فراداده را به روش add_metadata کلاس PdfWriter در کتابخانه pypdf ارسال می کنیم تا ابرداده سند PDF را به روز رسانی/نوشتن کنیم. برای جزئیات، قطعه کد زیر را بررسی کنید:
نتیجه گیری
در نتیجه، pypdf ثابت می کند که یک کتابخانه استثنایی پایتون برای خواندن و به روز رسانی ابرداده اسناد PDF است. توسعه دهندگان به راحتی می توانند متادیتا اسناد PDF را بدون هیچ مشکلی بخوانند و به روز کنند.