ไลบรารี่ข้อมูลเมตาโอเพ่นซอร์ส Python

ไลบรารี Python โอเพนซอร์สฟรีสำหรับอ่าน แก้ไข และอัปเดตข้อมูลเมตาของเอกสาร

Hachoir-metadata API สำหรับ Python คืออะไร?

hachoir-metadata คือไลบรารี Python ที่เป็นส่วนหนึ่งของ Hachoir project ที่ครอบคลุมกว่า ซึ่งออกแบบมาเพื่อการแยกและแยกข้อมูลเมตาจากไฟล์ประเภทต่างๆ ไลบรารีนี้มีเครื่องมือสำหรับอ่านข้อมูลเมตาโดยไม่จำเป็นต้องแตกไฟล์หรือถอดรหัสไฟล์ทั้งหมด ทำให้มีน้ำหนักเบาและมีประสิทธิภาพสำหรับงานตรวจสอบข้อมูลเมตาพื้นฐาน

คุณสมบัติของ API hachoir-metadata

hachoir-metadata is a powerful API that has rich features as follow:
  • การรองรับประเภทไฟล์ ทำงานได้กับรูปแบบไฟล์มากมาย รวมถึงรูปภาพ วิดีโอ ไฟล์เสียง ไฟล์เก็บถาวร และเอกสาร
  • การแยกข้อมูลเมตา: การแยกข้อมูลเมตาพื้นฐาน เช่น ขนาดไฟล์ วันที่สร้าง วันที่แก้ไข และคุณสมบัติเฉพาะรูปแบบอื่นๆ (เช่น EXIF สำหรับรูปภาพ ตัวแปลงสัญญาณสำหรับวิดีโอ เป็นต้น)
  • การดำเนินการแบบอ่านอย่างเดียว: มุ่งเน้นที่การอ่านและตรวจสอบข้อมูลเมตาโดยไม่แก้ไขไฟล์ต้นฉบับ
  • ไม่ระบุประเภทไฟล์: ตรวจจับประเภทไฟล์โดยอัตโนมัติและแยกข้อมูลเมตาตามนั้น
  • การรวมข้อมูล: สามารถรวมเข้ากับแอปพลิเคชัน Python เพื่อใช้งานในเวิร์กโฟลว์ เช่น การจัดระเบียบเนื้อหา การตรวจสอบทางนิติวิทยาศาสตร์ดิจิทัล และระบบการเก็บถาวรข้อมูล

โหมดของ API hachoir-metadata

  • โหมดคลาสสิก: ดึงข้อมูลเมตา คุณสามารถใช้ –level=LEVEL เพื่อจำกัดปริมาณข้อมูลที่จะแสดง (และไม่ดึงข้อมูลออกมา)
  • type: แสดงรูปแบบไฟล์และข้อมูลที่สำคัญที่สุดในบรรทัดเดียว
  • mime: แสดงเฉพาะประเภท MIME ของไฟล์

เริ่มต้นใช้งาน Hachoir API สำหรับ Python

GitHub

สถิติ GitHub

ชื่อ:
ภาษา:
ดาว:
ส้อม:
ใบอนุญาต:
พื้นที่เก็บข้อมูลได้รับการอัปเดตครั้งล่าสุดเมื่อ

หากต้องการใช้ Hachoir API สำหรับ Python คุณต้องติดตั้งเวอร์ชัน Python 3.6 ขึ้นไปและ Hachoir ในระบบของคุณ ดังนั้น ให้ติดตั้ง Python ก่อน จากนั้นใช้คำสั่งด้านล่างเพื่อติดตั้ง Hachoir API บนเครื่องของคุณโดยใช้ pip และ สภาพแวดล้อมเสมือน


pip install hachoir

Alternatively, you can also install hachoir from Github repository using the following steps:


1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]

การทำงานกับ API hachoir-metadata สำหรับ Python - ตัวอย่าง

API hachoir-metadata สำหรับ Python ช่วยให้คุณอ่านข้อมูลเมตาดาต้าจากประเภทไฟล์มีเดียได้ ด้วยโค้ดเพียงไม่กี่บรรทัด คุณสามารถพัฒนาแอปพลิเคชันอันทรงพลังที่สามารถอ่านข้อมูลเมตาดาต้าจากรูปแบบไฟล์ต่างๆ ได้ ตัวอย่างโค้ดต่อไปนี้แสดงให้เห็นว่าสามารถใช้ API hachoir-metadata ในแอปพลิเคชัน Python ได้อย่างไร

การทำงานกับ API hachoir-metadata สำหรับ Python - ตัวอย่าง

pyExifTool ช่วยให้คุณอ่านข้อมูลเมตาของไฟล์ในรูปแบบต่างๆ เช่น PDF, BMP, JPEG, DOCX, XLSX และอื่นๆ อีกมากมาย API ช่วยให้คุณอ่านข้อมูลเมตาของไฟล์โดยใช้เมธอด get_metadata ตรวจสอบตัวอย่างโค้ดด้านล่างซึ่งเราอ่านข้อมูลเมตาจากไฟล์ PDF

เอาท์พุต

เมื่อคุณดำเนินการโค้ดนี้ ผลลัพธ์จะออกมาคล้ายกับต่อไปนี้ (ขึ้นอยู่กับข้อมูลที่มีอยู่ในไฟล์ตัวอย่างของคุณ:


Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian

บทสรุป

API ของ hachoir-metadata นำเสนอโซลูชันที่มีประสิทธิภาพแต่มีน้ำหนักเบาสำหรับการดึงข้อมูลเมตาจากรูปแบบไฟล์ที่หลากหลาย ทำให้เป็นเครื่องมือที่ยอดเยี่ยมสำหรับนักพัฒนา Python ที่ทำงานในด้านต่างๆ เช่น นิติวิทยาศาสตร์ดิจิทัล การจัดการเนื้อหา และการวิเคราะห์ข้อมูล ความสามารถในการแยกไฟล์โดยไม่ต้องปรับเปลี่ยนทำให้มั่นใจได้ถึงความสมบูรณ์ของข้อมูล ในขณะที่อินเทอร์เฟซ Pythonic ช่วยให้การรวมเข้ากับแอปพลิเคชันและเวิร์กโฟลว์ง่ายขึ้น ด้วยการรองรับประเภทไฟล์และคุณสมบัติเมตาดาต้าที่หลากหลาย hachoir-metadata จึงเป็นตัวเลือกที่หลากหลายสำหรับการตรวจสอบเมตาดาต้าอย่างรวดเร็วและมีประสิทธิภาพสำหรับทั้งโครงการ/ระบบส่วนตัวและระดับมืออาชีพ

สินค้าที่คล้ายกัน

 Thai