1. محصولات
  2.   فراداده
  3.   Python
  4.   hachoir-metadata
 
  

کتابخانه فراداده پایتون منبع باز

کتابخانه رایگان و منبع باز پایتون برای خواندن، ویرایش و به روز رسانی ابرداده اسناد.

Hachoir-metadata API برای پایتون چیست؟

hachoir-metadata یک کتابخانه پایتون است که بخشی از پروژه Hachoir گسترده‌تر است، که برای تجزیه و استخراج ابرداده از طیف گسترده‌ای از فایل‌ها طراحی شده است. انواع این ابزارها را برای خواندن ابرداده ها بدون نیاز به فشرده سازی یا رمزگشایی کامل فایل ها فراهم می کند و آن را برای کارهای بازرسی ابرداده های اولیه سبک و کارآمد می کند.

ویژگی های hachoir-metadata API

hachoir-metadata is a powerful API that has rich features as follow:
  • پشتیبانی از نوع فایل: با بسیاری از قالب‌های فایل، از جمله تصاویر، ویدئوها، فایل‌های صوتی، بایگانی‌ها و اسناد کار می‌کند.
  • استخراج فراداده: ابرداده‌های اساسی مانند اندازه فایل، تاریخ ایجاد، تاریخ اصلاح، و ویژگی‌های خاص فرمت (مانند EXIF برای تصاویر، کدک‌ها برای ویدیوها و غیره) را استخراج می‌کند.
  • عملیات فقط خواندنی: بر خواندن و بازرسی فراداده ها بدون تغییر فایل اصلی تمرکز می کند.
  • نوع فایل Agnostic: به طور خودکار انواع فایل ها را شناسایی می کند و متادیتا را بر اساس آن استخراج می کند.
  • ادغام: می‌تواند در برنامه‌های پایتون برای استفاده در جریان‌های کاری مانند سازمان‌دهی محتوا، پزشکی قانونی دیجیتال و سیستم‌های بایگانی ادغام شود.

حالت‌های hachoir-metadata API

  • حالت کلاسیک: فراداده را استخراج کنید، می توانید از –level=LEVEL برای محدود کردن مقدار اطلاعات برای نمایش (و نه برای استخراج) استفاده کنید.
  • type: فرمت فایل و مهمترین اطلاعات را در یک خط نشان دهید
  • mime: فقط نوع فایل MIME را نمایش دهید

شروع به کار با Hachoir API برای پایتون

GitHub

آمار GitHub

نام:
زبان:
ستاره ها:
چنگال:
مجوز:
آخرین به روز رسانی مخزن در

برای استفاده از Hachoir API برای Python، باید نسخه Python 3.6+ و Hachoir را روی سیستم خود نصب کنید. بنابراین، ابتدا Python را نصب کنید و سپس از دستورات زیر برای نصب Hachoir API بر روی دستگاه خود با استفاده از pip و محیط مجازی.


pip install hachoir

Alternatively, you can also install hachoir from Github repository using the following steps:


1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]

کار با hachoir-metadata API برای Python - مثال ها

hachoir-metadata API برای پایتون به شما امکان می دهد اطلاعات فراداده را از انواع فایل های رسانه ای بخوانید. تنها با چند خط کد، می توانید برنامه های قدرتمندی را توسعه دهید که می توانند اطلاعات فراداده را از فرمت های مختلف فایل بخوانند. نمونه‌های کد زیر نشان می‌دهند که چگونه می‌توان از hachoir-metadata API در برنامه‌های پایتون استفاده کرد.

کار با hachoir-metadata API برای Python - مثال ها

pyExifTool به شما برای خواندن متادیتا از انواع فرمت های فایل مانند PDF، BMP، JPEG، DOCX، XLSX و بسیاری دیگر پشتیبانی می کند. API به شما امکان می‌دهد اطلاعات فراداده یک فایل را با استفاده از روش get_metadata بخوانید. قطعه کد زیر را که در آن اطلاعات فراداده را از یک فایل PDF می خوانیم، بررسی کنید.

خروجی

هنگامی که این کد را اجرا می کنید، خروجی تا حدودی مشابه موارد زیر خواهد بود (بسته به اطلاعات موجود در فایل نمونه شما:


Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian

نتیجه گیری

hachoir-metadata API یک راه حل قدرتمند و در عین حال سبک برای استخراج ابرداده از انواع فرمت های فایل ارائه می دهد که آن را به ابزاری عالی برای توسعه دهندگان پایتون که در زمینه هایی مانند پزشکی قانونی دیجیتال، مدیریت محتوا و تجزیه و تحلیل داده ها کار می کنند، تبدیل می کند. توانایی آن در تجزیه فایل ها بدون تغییر، یکپارچگی داده ها را تضمین می کند، در حالی که رابط پایتونیک آن ادغام با برنامه ها و گردش کار را ساده می کند. با پشتیبانی از انواع فایل‌ها و ویژگی‌های فراداده، hachoir-metadata یک انتخاب همه کاره برای بازرسی سریع و کارآمد ابرداده برای پروژه‌ها و سیستم‌های شخصی و حرفه‌ای است.

محصولات مشابه

 فارسی