ספריית מטא נתונים בקוד פתוח של Python

ספריית Python בחינם וקוד פתוח לקריאה, עריכה ועדכון מטא נתונים של מסמכים.

מהו Hachoir-metadata API עבור Python?

hachoir-metadata היא ספריית Python שהיא חלק מפרויקט Hachoir הרחב יותר, המיועד לניתוח וחילוץ מטא נתונים ממגוון רחב של קבצים סוגים. הוא מספק כלים לקריאת מטא נתונים ללא צורך בפירוק או פענוח מלא של הקבצים, מה שהופך אותו לקל משקל ויעיל עבור משימות בדיקת מטא נתונים בסיסיות.

תכונות של hachoir-metadata API

hachoir-metadata is a powerful API that has rich features as follow:
  • תמיכה בסוג קבצים: עובד עם פורמטים רבים של קבצים, כולל תמונות, סרטונים, קובצי שמע, ארכיונים ומסמכים.
  • חילוץ מטא נתונים: מחלץ מטא נתונים בסיסיים כגון גודל קובץ, תאריך יצירה, תאריך שינוי ומאפיינים ספציפיים יותר לפורמט (למשל, EXIF לתמונות, קודקים לסרטונים וכו').
  • פעולות לקריאה בלבד: מתמקד בקריאה ובדיקת מטא נתונים מבלי לשנות את הקובץ המקורי.
  • סוג קובץ Agnostic: מזהה אוטומטית סוגי קבצים ומחלץ מטא נתונים בהתאם.
  • אינטגרציה: ניתן לשלב ביישומי Python לשימוש בזרימות עבודה כמו ארגון תוכן, זיהוי פלילי דיגיטלי ומערכות ארכיון.

מצבים של hachoir-metadata API

  • מצב קלאסי: חילוץ מטא נתונים, אתה יכול להשתמש –level=LEVEL כדי להגביל את כמות המידע להצגה (ולא לחילוץ)
  • type: הצג בשורה אחת את פורמט הקובץ והמידע החשוב ביותר
  • mime: רק הצג את סוג הקובץ MIME

תחילת העבודה עם Hachoir API עבור Python

GitHub

סטטיסטיקות GitHub

שֵׁם:
שפה:
כוכבים:
מזלגות:
רישיון:
המאגר עודכן לאחרונה ב

על מנת להשתמש ב-Hachoir API עבור Python, עליך להתקין את Python 3.6+ גרסת וHachoir במערכת שלך. אז, תחילה התקן את Python ולאחר מכן השתמש בפקודות הבאות כדי להתקין את Hachoir API במחשב שלך באמצעות pip וסביבה וירטואלית.


pip install hachoir

Alternatively, you can also install hachoir from Github repository using the following steps:


1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]

עבודה עם hachoir-metadata API עבור Python - דוגמאות

hachoir-metadata API עבור Python מאפשר לך לקרוא את מידע המטא נתונים מסוגי קבצי מדיה. עם מספר שורות קוד בלבד, אתה יכול לפתח יישומים רבי עוצמה שיכולים לקרוא מידע מטא נתונים מפורמטים שונים של קבצים. דוגמאות הקוד הבאות מראות כיצד ניתן להשתמש ב-hachoir-metadata API ביישומי Python.

עבודה עם hachoir-metadata API עבור Python - דוגמאות

pyExifTool מספק לך תמיכה לקריאת מטא נתונים של מגוון פורמטים של קבצים כגון PDF, BMP, JPEG, DOCX, XLSX ועוד רבים אחרים. ה-API מאפשר לך לקרוא את מידע המטא נתונים של קובץ באמצעות שיטת get_metadata. בדוק את קטע הקוד שלהלן שבו אנו קוראים את מידע המטא נתונים מקובץ PDF.

תְפוּקָה

כאשר אתה מפעיל את הקוד הזה, הפלט יהיה דומה במקצת לפרק הבא (בהתאם למידע הזמין בקובץ לדוגמה שלך:


Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian

מַסְקָנָה

ה-hachoir-metadata API מציע פתרון רב עוצמה אך קל משקל לחילוץ מטא נתונים ממגוון רחב של פורמטים של קבצים, מה שהופך אותו לכלי מצוין עבור מפתחי פיתון הפועלים בתחומים כמו זיהוי פלילי דיגיטלי, ניהול תוכן וניתוח נתונים. היכולת שלו לנתח קבצים ללא שינוי מבטיחה שלמות הנתונים, בעוד הממשק הפיתוני שלו מפשט את האינטגרציה באפליקציות ובזרימות עבודה. עם תמיכה בסוגי קבצים ומאפייני מטא נתונים מגוונים, hachoir-metadata היא בחירה מגוונת לבדיקת מטא נתונים מהירה ויעילה עבור פרויקטים/מערכות אישיים ומקצועיים כאחד.

מוצרים דומים

 Hebrew