کتابخانه فراداده پایتون منبع باز برای اسناد PDF

کتابخانه رایگان و منبع باز Python برای خواندن، ویرایش و به روز رسانی ابرداده فایل های PDF.

PikePDF برای پایتون چیست؟

PikePDF یک کتابخانه مدرن پایتون است که برای دستکاری یکپارچه PDF طراحی شده است، با قابلیت های قدرتمند برای کار به طور خاص با ابرداده. PikePDF که بر روی کتابخانه قوی QPDF ساخته شده است به توسعه دهندگان این امکان را می دهد که به راحتی ابرداده ها را از فایل های PDF اضافه، ویرایش و حذف کنند و آن را به ابزاری ضروری برای سازماندهی و غنی سازی اطلاعات اسناد تبدیل می کند. چه نیاز به به‌روزرسانی عناوین، نویسندگان، فیلدهای موضوعی یا ورودی‌های فراداده سفارشی داشته باشید، PikePDF یک API پایتونیک و بصری برای مدیریت این جزئیات به صورت برنامه‌نویسی ارائه می‌کند. همچنین از مدیریت ابرداده‌های جاسازی‌شده برای طبقه‌بندی اسناد و قابلیت جستجوی پیشرفته پشتیبانی می‌کند و از انطباق با گردش‌های کاری که به شدت به شرح جزئیات سند متکی هستند، اطمینان می‌دهد. PikePDF با تمرکز بر قابلیت اطمینان و عملکرد، برای خودکارسازی وظایف مدیریت ابرداده در سیستم‌های پردازش اسناد یا بهبود گردش‌های کاری PDF مبتنی بر ابرداده ایده‌آل است.

ویژگی های PikePDF API

PikePDF API for Python has rich set of features for working with the metadata of the PDF documents. Some of its features are as listed below.
  • دستکاری PDF: صفحات را در فایل‌های PDF ادغام کنید، تقسیم کنید، بچرخانید و مرتب کنید.
  • مدیریت فراداده: برای بهبود سازماندهی و اطلاعات PDF، متادیتا را اضافه، ویرایش یا حذف کنید.
  • رمزگذاری و امنیت: فایل‌های PDF را با گذرواژه رمزگذاری کنید، قفل PDF‌های ایمن را باز کنید و تنظیمات امنیتی را مدیریت کنید.
  • تعمیر فایل های خراب: مشکلات موجود در اسناد PDF آسیب دیده یا خراب را شناسایی و برطرف کنید.
  • تبدیل PDF/A: برای آرشیو طولانی مدت و مطابقت، فایل‌های PDF را به فرمت PDF/A تبدیل کنید.
  • پشتیبانی از قلم جاسازی شده: فونت های جاسازی شده را برای سازگاری و سازگاری متن مدیریت کنید.
  • عملکرد گرا: بهینه شده برای عملیات سریع و قابل اعتماد با فایل های PDF بزرگ یا پیچیده.
  • بر اساس QPDF: از کتابخانه قدرتمند QPDF برای قابلیت های پیشرفته دستکاری PDF استفاده می کند.
  • منبع باز: رایگان برای استفاده و به طور فعال توسط انجمن برنامه‌نویس نگهداری می‌شود.

مزایای استفاده از PikePDF API

  • مدیریت فراداده: به راحتی ابرداده ها را اضافه، ویرایش یا حذف کنید تا سازماندهی و جستجوی PDF را افزایش دهید.
  • پشتیبانی PDF/A: با حفظ یا به‌روزرسانی متادیتا، فایل‌های PDF را به قالب‌های آرشیوی تبدیل کنید.
  • مدیریت فساد: فایل‌های PDF آسیب‌دیده را بدون از دست دادن متادیتا تعمیر و بازیابی کنید.
  • رمزگذاری و امنیت: حفاظت از رمز عبور و رمزگذاری را با حفظ یکپارچگی ابرداده مدیریت کنید.
  • فراداده سفارشی: فیلدهای سفارشی را برای سفارشی کردن فراداده PDF برای گردش کار یا الزامات تجاری خاص اضافه کنید.
  • عملکرد بالا: برای پردازش سریع و کارآمد فایل‌های PDF بزرگ و پیچیده بهینه شده است.
  • منبع باز: رایگان و فعالانه نگهداری می شود، راه حلی قابل اعتماد و مقرون به صرفه ارائه می دهد.
  • بر اساس QPDF: از ویژگی‌های قدرتمند QPDF برای عملیات پیشرفته PDF و ابرداده استفاده می‌کند.

شروع به کار با PikePDF API برای پایتون

GitHub

آمار GitHub

نام:
زبان:
ستاره ها:
چنگال:
مجوز:
آخرین به روز رسانی مخزن در

با استفاده از PikePDF در برنامه‌های پایتون، باید نسخه 3.9+ پایتون را روی سیستم خود نصب کنید. بنابراین، ابتدا Python را نصب کنید و سپس از دستورات زیر برای نصب Hachoir API بر روی دستگاه خود با استفاده از pip و محیط مجازی.


pip install pikepdf

کار با PikePDF API برای پایتون - مثال ها

شما می توانید از PikePDF برای خواندن، نوشتن و به روز رسانی اطلاعات فراداده فایل های PDF استفاده کنید. API روش‌ها و نمونه‌هایی را برای کار با فایل‌های PDF از درون برنامه‌های پایتون شما فراهم می‌کند.

اطلاعات فراداده یک فایل را با استفاده از PikePDF API برای پایتون بخوانید

خواندن اطلاعات فراداده از فایل PDF با استفاده از فایل PikePDF آسان است. می توانید از کد نمونه زیر برای خواندن اطلاعات فراداده از هر سند PDF استفاده کنید.

خروجی

هنگامی که این کد را اجرا می کنید، خروجی تا حدودی شبیه به زیر خواهد بود:


PDF Metadata:
/Title: Sample PDF Document
/Author: John Doe
/Subject: Example Usage
/Producer: Adobe PDF Library
/CreationDate: D:20241226093000Z

اگر هیچ اطلاعات فراداده ای در فایل موجود نباشد، خروجی خالی خواهد بود.

اطلاعات فراداده را با استفاده از PikePDF API برای پایتون در یک فایل PDF بنویسید

PikePDF می تواند ابرداده یک فایل PDF را بنویسد یا به روز کند. این کتابخانه به شما امکان می دهد فیلدهای فوق داده موجود را تغییر دهید یا موارد جدید اضافه کنید. در اینجا یک مثال نشان می دهد که چگونه به روز رسانی ابرداده در یک فایل PDF را نشان می دهد:

در اینجا چند فیلد استاندارد رایج وجود دارد که می توانید آن ها را به روز کنید:


Title: The title of the document.
Author: The author of the document.
Subject: The subject or topic of the document.
Keywords: Keywords associated with the document for search purposes.
Creator: The application that created the document.
Producer: The software that generated the PDF.
CreationDate: The date the document was created.
ModDate: The date the document was last modified.

نتیجه گیری برای PikePDF API

PikePDF is a powerful and user-friendly Python library that simplifies the handling of PDF files, especially for metadata management. Built on the robust QPDF library, it offers seamless capabilities to read, write, and update metadata fields, enabling developers to organize, enrich, and customize PDF documents effectively. In addition to metadata operations, PikePDF excels at tasks like repairing corrupt PDFs, managing encryption, and converting files to PDF/A format, making it a versatile tool for a wide range of PDF-related workflows. Its open-source nature, active maintenance, and Pythonic API make it an excellent choice for developers looking for a reliable and efficient solution for PDF processing and metadata management. Whether you’re automating document workflows, ensuring compliance with archival standards, or enhancing PDF metadata for searchability, PikePDF provides the tools you need to work with PDFs effortlessly.

محصولات مشابه

 فارسی