کتابخانه فراداده پایتون منبع باز برای اسناد PDF
کتابخانه رایگان و منبع باز Python برای خواندن، ویرایش و به روز رسانی ابرداده فایل های PDF.
PikePDF برای پایتون چیست؟
PikePDF یک کتابخانه مدرن پایتون است که برای دستکاری یکپارچه PDF طراحی شده است، با قابلیت های قدرتمند برای کار به طور خاص با ابرداده. PikePDF که بر روی کتابخانه قوی QPDF ساخته شده است به توسعه دهندگان این امکان را می دهد که به راحتی ابرداده ها را از فایل های PDF اضافه، ویرایش و حذف کنند و آن را به ابزاری ضروری برای سازماندهی و غنی سازی اطلاعات اسناد تبدیل می کند. چه نیاز به بهروزرسانی عناوین، نویسندگان، فیلدهای موضوعی یا ورودیهای فراداده سفارشی داشته باشید، PikePDF یک API پایتونیک و بصری برای مدیریت این جزئیات به صورت برنامهنویسی ارائه میکند. همچنین از مدیریت ابردادههای جاسازیشده برای طبقهبندی اسناد و قابلیت جستجوی پیشرفته پشتیبانی میکند و از انطباق با گردشهای کاری که به شدت به شرح جزئیات سند متکی هستند، اطمینان میدهد. PikePDF با تمرکز بر قابلیت اطمینان و عملکرد، برای خودکارسازی وظایف مدیریت ابرداده در سیستمهای پردازش اسناد یا بهبود گردشهای کاری PDF مبتنی بر ابرداده ایدهآل است.
ویژگی های PikePDF API
PikePDF API for Python has rich set of features for working with the metadata of the PDF documents. Some of its features are as listed below.- دستکاری PDF: صفحات را در فایلهای PDF ادغام کنید، تقسیم کنید، بچرخانید و مرتب کنید.
- مدیریت فراداده: برای بهبود سازماندهی و اطلاعات PDF، متادیتا را اضافه، ویرایش یا حذف کنید.
- رمزگذاری و امنیت: فایلهای PDF را با گذرواژه رمزگذاری کنید، قفل PDFهای ایمن را باز کنید و تنظیمات امنیتی را مدیریت کنید.
- تعمیر فایل های خراب: مشکلات موجود در اسناد PDF آسیب دیده یا خراب را شناسایی و برطرف کنید.
- تبدیل PDF/A: برای آرشیو طولانی مدت و مطابقت، فایلهای PDF را به فرمت PDF/A تبدیل کنید.
- پشتیبانی از قلم جاسازی شده: فونت های جاسازی شده را برای سازگاری و سازگاری متن مدیریت کنید.
- عملکرد گرا: بهینه شده برای عملیات سریع و قابل اعتماد با فایل های PDF بزرگ یا پیچیده.
- بر اساس QPDF: از کتابخانه قدرتمند QPDF برای قابلیت های پیشرفته دستکاری PDF استفاده می کند.
- منبع باز: رایگان برای استفاده و به طور فعال توسط انجمن برنامهنویس نگهداری میشود.
مزایای استفاده از PikePDF API
- مدیریت فراداده: به راحتی ابرداده ها را اضافه، ویرایش یا حذف کنید تا سازماندهی و جستجوی PDF را افزایش دهید.
- پشتیبانی PDF/A: با حفظ یا بهروزرسانی متادیتا، فایلهای PDF را به قالبهای آرشیوی تبدیل کنید.
- مدیریت فساد: فایلهای PDF آسیبدیده را بدون از دست دادن متادیتا تعمیر و بازیابی کنید.
- رمزگذاری و امنیت: حفاظت از رمز عبور و رمزگذاری را با حفظ یکپارچگی ابرداده مدیریت کنید.
- فراداده سفارشی: فیلدهای سفارشی را برای سفارشی کردن فراداده PDF برای گردش کار یا الزامات تجاری خاص اضافه کنید.
- عملکرد بالا: برای پردازش سریع و کارآمد فایلهای PDF بزرگ و پیچیده بهینه شده است.
- منبع باز: رایگان و فعالانه نگهداری می شود، راه حلی قابل اعتماد و مقرون به صرفه ارائه می دهد.
- بر اساس QPDF: از ویژگیهای قدرتمند QPDF برای عملیات پیشرفته PDF و ابرداده استفاده میکند.
شروع به کار با PikePDF API برای پایتون
با استفاده از PikePDF در برنامههای پایتون، باید نسخه 3.9+ پایتون را روی سیستم خود نصب کنید. بنابراین، ابتدا Python را نصب کنید و سپس از دستورات زیر برای نصب Hachoir API بر روی دستگاه خود با استفاده از pip و محیط مجازی.
pip install pikepdf
کار با PikePDF API برای پایتون - مثال ها
شما می توانید از PikePDF برای خواندن، نوشتن و به روز رسانی اطلاعات فراداده فایل های PDF استفاده کنید. API روشها و نمونههایی را برای کار با فایلهای PDF از درون برنامههای پایتون شما فراهم میکند.
اطلاعات فراداده یک فایل را با استفاده از PikePDF API برای پایتون بخوانید
خواندن اطلاعات فراداده از فایل PDF با استفاده از فایل PikePDF آسان است. می توانید از کد نمونه زیر برای خواندن اطلاعات فراداده از هر سند PDF استفاده کنید.
خروجی
هنگامی که این کد را اجرا می کنید، خروجی تا حدودی شبیه به زیر خواهد بود:
PDF Metadata:
/Title: Sample PDF Document
/Author: John Doe
/Subject: Example Usage
/Producer: Adobe PDF Library
/CreationDate: D:20241226093000Z
اگر هیچ اطلاعات فراداده ای در فایل موجود نباشد، خروجی خالی خواهد بود.
اطلاعات فراداده را با استفاده از PikePDF API برای پایتون در یک فایل PDF بنویسید
PikePDF می تواند ابرداده یک فایل PDF را بنویسد یا به روز کند. این کتابخانه به شما امکان می دهد فیلدهای فوق داده موجود را تغییر دهید یا موارد جدید اضافه کنید. در اینجا یک مثال نشان می دهد که چگونه به روز رسانی ابرداده در یک فایل PDF را نشان می دهد:
در اینجا چند فیلد استاندارد رایج وجود دارد که می توانید آن ها را به روز کنید:
Title: The title of the document.
Author: The author of the document.
Subject: The subject or topic of the document.
Keywords: Keywords associated with the document for search purposes.
Creator: The application that created the document.
Producer: The software that generated the PDF.
CreationDate: The date the document was created.
ModDate: The date the document was last modified.