کتابخانه فراداده پایتون منبع باز
کتابخانه رایگان و منبع باز پایتون برای خواندن، ویرایش و به روز رسانی ابرداده اسناد.
Hachoir-metadata API برای پایتون چیست؟
hachoir-metadata یک کتابخانه پایتون است که بخشی از پروژه Hachoir گستردهتر است، که برای تجزیه و استخراج ابرداده از طیف گستردهای از فایلها طراحی شده است. انواع این ابزارها را برای خواندن ابرداده ها بدون نیاز به فشرده سازی یا رمزگشایی کامل فایل ها فراهم می کند و آن را برای کارهای بازرسی ابرداده های اولیه سبک و کارآمد می کند.
ویژگی های hachoir-metadata API
hachoir-metadata is a powerful API that has rich features as follow:- پشتیبانی از نوع فایل: با بسیاری از قالبهای فایل، از جمله تصاویر، ویدئوها، فایلهای صوتی، بایگانیها و اسناد کار میکند.
- استخراج فراداده: ابردادههای اساسی مانند اندازه فایل، تاریخ ایجاد، تاریخ اصلاح، و ویژگیهای خاص فرمت (مانند EXIF برای تصاویر، کدکها برای ویدیوها و غیره) را استخراج میکند.
- عملیات فقط خواندنی: بر خواندن و بازرسی فراداده ها بدون تغییر فایل اصلی تمرکز می کند.
- نوع فایل Agnostic: به طور خودکار انواع فایل ها را شناسایی می کند و متادیتا را بر اساس آن استخراج می کند.
- ادغام: میتواند در برنامههای پایتون برای استفاده در جریانهای کاری مانند سازماندهی محتوا، پزشکی قانونی دیجیتال و سیستمهای بایگانی ادغام شود.
حالتهای hachoir-metadata API
- حالت کلاسیک: فراداده را استخراج کنید، می توانید از –level=LEVEL برای محدود کردن مقدار اطلاعات برای نمایش (و نه برای استخراج) استفاده کنید.
- type: فرمت فایل و مهمترین اطلاعات را در یک خط نشان دهید
- mime: فقط نوع فایل MIME را نمایش دهید
شروع به کار با Hachoir API برای پایتون
برای استفاده از Hachoir API برای Python، باید نسخه Python 3.6+ و Hachoir را روی سیستم خود نصب کنید. بنابراین، ابتدا Python را نصب کنید و سپس از دستورات زیر برای نصب Hachoir API بر روی دستگاه خود با استفاده از pip و محیط مجازی.
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
کار با hachoir-metadata API برای Python - مثال ها
hachoir-metadata API برای پایتون به شما امکان می دهد اطلاعات فراداده را از انواع فایل های رسانه ای بخوانید. تنها با چند خط کد، می توانید برنامه های قدرتمندی را توسعه دهید که می توانند اطلاعات فراداده را از فرمت های مختلف فایل بخوانند. نمونههای کد زیر نشان میدهند که چگونه میتوان از hachoir-metadata API در برنامههای پایتون استفاده کرد.
کار با hachoir-metadata API برای Python - مثال ها
pyExifTool به شما برای خواندن متادیتا از انواع فرمت های فایل مانند PDF، BMP، JPEG، DOCX، XLSX و بسیاری دیگر پشتیبانی می کند. API به شما امکان میدهد اطلاعات فراداده یک فایل را با استفاده از روش get_metadata بخوانید. قطعه کد زیر را که در آن اطلاعات فراداده را از یک فایل PDF می خوانیم، بررسی کنید.
خروجی
هنگامی که این کد را اجرا می کنید، خروجی تا حدودی مشابه موارد زیر خواهد بود (بسته به اطلاعات موجود در فایل نمونه شما:
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
نتیجه گیری
hachoir-metadata API یک راه حل قدرتمند و در عین حال سبک برای استخراج ابرداده از انواع فرمت های فایل ارائه می دهد که آن را به ابزاری عالی برای توسعه دهندگان پایتون که در زمینه هایی مانند پزشکی قانونی دیجیتال، مدیریت محتوا و تجزیه و تحلیل داده ها کار می کنند، تبدیل می کند. توانایی آن در تجزیه فایل ها بدون تغییر، یکپارچگی داده ها را تضمین می کند، در حالی که رابط پایتونیک آن ادغام با برنامه ها و گردش کار را ساده می کند. با پشتیبانی از انواع فایلها و ویژگیهای فراداده، hachoir-metadata یک انتخاب همه کاره برای بازرسی سریع و کارآمد ابرداده برای پروژهها و سیستمهای شخصی و حرفهای است.