ไลบรารี่ข้อมูลเมตาโอเพ่นซอร์ส Python
ไลบรารี Python โอเพนซอร์สฟรีสำหรับอ่าน แก้ไข และอัปเดตข้อมูลเมตาของเอกสาร
Hachoir-metadata API สำหรับ Python คืออะไร?
hachoir-metadata คือไลบรารี Python ที่เป็นส่วนหนึ่งของ Hachoir project ที่ครอบคลุมกว่า ซึ่งออกแบบมาเพื่อการแยกและแยกข้อมูลเมตาจากไฟล์ประเภทต่างๆ ไลบรารีนี้มีเครื่องมือสำหรับอ่านข้อมูลเมตาโดยไม่จำเป็นต้องแตกไฟล์หรือถอดรหัสไฟล์ทั้งหมด ทำให้มีน้ำหนักเบาและมีประสิทธิภาพสำหรับงานตรวจสอบข้อมูลเมตาพื้นฐาน
คุณสมบัติของ API hachoir-metadata
hachoir-metadata is a powerful API that has rich features as follow:- การรองรับประเภทไฟล์ ทำงานได้กับรูปแบบไฟล์มากมาย รวมถึงรูปภาพ วิดีโอ ไฟล์เสียง ไฟล์เก็บถาวร และเอกสาร
- การแยกข้อมูลเมตา: การแยกข้อมูลเมตาพื้นฐาน เช่น ขนาดไฟล์ วันที่สร้าง วันที่แก้ไข และคุณสมบัติเฉพาะรูปแบบอื่นๆ (เช่น EXIF สำหรับรูปภาพ ตัวแปลงสัญญาณสำหรับวิดีโอ เป็นต้น)
- การดำเนินการแบบอ่านอย่างเดียว: มุ่งเน้นที่การอ่านและตรวจสอบข้อมูลเมตาโดยไม่แก้ไขไฟล์ต้นฉบับ
- ไม่ระบุประเภทไฟล์: ตรวจจับประเภทไฟล์โดยอัตโนมัติและแยกข้อมูลเมตาตามนั้น
- การรวมข้อมูล: สามารถรวมเข้ากับแอปพลิเคชัน Python เพื่อใช้งานในเวิร์กโฟลว์ เช่น การจัดระเบียบเนื้อหา การตรวจสอบทางนิติวิทยาศาสตร์ดิจิทัล และระบบการเก็บถาวรข้อมูล
โหมดของ API hachoir-metadata
- โหมดคลาสสิก: ดึงข้อมูลเมตา คุณสามารถใช้ –level=LEVEL เพื่อจำกัดปริมาณข้อมูลที่จะแสดง (และไม่ดึงข้อมูลออกมา)
- type: แสดงรูปแบบไฟล์และข้อมูลที่สำคัญที่สุดในบรรทัดเดียว
- mime: แสดงเฉพาะประเภท MIME ของไฟล์
เริ่มต้นใช้งาน Hachoir API สำหรับ Python
หากต้องการใช้ Hachoir API สำหรับ Python คุณต้องติดตั้งเวอร์ชัน Python 3.6 ขึ้นไปและ Hachoir ในระบบของคุณ ดังนั้น ให้ติดตั้ง Python ก่อน จากนั้นใช้คำสั่งด้านล่างเพื่อติดตั้ง Hachoir API บนเครื่องของคุณโดยใช้ pip และ สภาพแวดล้อมเสมือน
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
การทำงานกับ API hachoir-metadata สำหรับ Python - ตัวอย่าง
API hachoir-metadata สำหรับ Python ช่วยให้คุณอ่านข้อมูลเมตาดาต้าจากประเภทไฟล์มีเดียได้ ด้วยโค้ดเพียงไม่กี่บรรทัด คุณสามารถพัฒนาแอปพลิเคชันอันทรงพลังที่สามารถอ่านข้อมูลเมตาดาต้าจากรูปแบบไฟล์ต่างๆ ได้ ตัวอย่างโค้ดต่อไปนี้แสดงให้เห็นว่าสามารถใช้ API hachoir-metadata ในแอปพลิเคชัน Python ได้อย่างไร
การทำงานกับ API hachoir-metadata สำหรับ Python - ตัวอย่าง
pyExifTool ช่วยให้คุณอ่านข้อมูลเมตาของไฟล์ในรูปแบบต่างๆ เช่น PDF, BMP, JPEG, DOCX, XLSX และอื่นๆ อีกมากมาย API ช่วยให้คุณอ่านข้อมูลเมตาของไฟล์โดยใช้เมธอด get_metadata ตรวจสอบตัวอย่างโค้ดด้านล่างซึ่งเราอ่านข้อมูลเมตาจากไฟล์ PDF
เอาท์พุต
เมื่อคุณดำเนินการโค้ดนี้ ผลลัพธ์จะออกมาคล้ายกับต่อไปนี้ (ขึ้นอยู่กับข้อมูลที่มีอยู่ในไฟล์ตัวอย่างของคุณ:
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
บทสรุป
API ของ hachoir-metadata นำเสนอโซลูชันที่มีประสิทธิภาพแต่มีน้ำหนักเบาสำหรับการดึงข้อมูลเมตาจากรูปแบบไฟล์ที่หลากหลาย ทำให้เป็นเครื่องมือที่ยอดเยี่ยมสำหรับนักพัฒนา Python ที่ทำงานในด้านต่างๆ เช่น นิติวิทยาศาสตร์ดิจิทัล การจัดการเนื้อหา และการวิเคราะห์ข้อมูล ความสามารถในการแยกไฟล์โดยไม่ต้องปรับเปลี่ยนทำให้มั่นใจได้ถึงความสมบูรณ์ของข้อมูล ในขณะที่อินเทอร์เฟซ Pythonic ช่วยให้การรวมเข้ากับแอปพลิเคชันและเวิร์กโฟลว์ง่ายขึ้น ด้วยการรองรับประเภทไฟล์และคุณสมบัติเมตาดาต้าที่หลากหลาย hachoir-metadata จึงเป็นตัวเลือกที่หลากหลายสำหรับการตรวจสอบเมตาดาต้าอย่างรวดเร็วและมีประสิทธิภาพสำหรับทั้งโครงการ/ระบบส่วนตัวและระดับมืออาชีพ
สินค้าที่คล้ายกัน
- pdf-lib สำหรับ JavaScript | จัดการข้อมูลเมตาของ PDF ได้อย่างง่ายดาย
- pyExifTool | โอเพ่นซอร์ส Python API สำหรับข้อมูลเมตาของเอกสาร
- PyMuPDF ไลบรารี Python สำหรับข้อมูลเมตาของ PDF | โอเพ่นซอร์ส
- pypdf | ไลบรารี Python สำหรับการจัดการข้อมูลเมตาของ PDF
- tika-python | โอเพ่นซอร์ส Python API สำหรับข้อมูลเมตาของเอกสาร