ओपन सोर्स पायथन मेटाडेटा लाइब्रेरी
दस्तावेजों के मेटाडेटा को पढ़ने, संपादित करने और अद्यतन करने के लिए निःशुल्क और खुला स्रोत पायथन लाइब्रेरी।
पायथन के लिए Hachoir-मेटाडेटा API क्या है?
hachoir-metadata एक पायथन लाइब्रेरी है जो व्यापक Hachoir प्रोजेक्ट का हिस्सा है, जिसे विभिन्न प्रकार की फ़ाइल प्रकारों से मेटाडेटा को पार्स करने और निकालने के लिए डिज़ाइन किया गया है। यह फ़ाइलों को डीकंप्रेस या पूरी तरह से डिकोड किए बिना मेटाडेटा को पढ़ने के लिए उपकरण प्रदान करता है, जिससे यह बुनियादी मेटाडेटा निरीक्षण कार्यों के लिए हल्का और कुशल बन जाता है।
hachoir-मेटाडाटा API की विशेषताएं
hachoir-metadata is a powerful API that has rich features as follow:- फ़ाइल प्रकार समर्थन: छवियों, वीडियो, ऑडियो फ़ाइलों, अभिलेखों और दस्तावेज़ों सहित कई फ़ाइल स्वरूपों के साथ काम करता है।
- मेटाडेटा निष्कर्षण: मूलभूत मेटाडेटा जैसे फ़ाइल आकार, निर्माण तिथि, संशोधन तिथि, और अधिक प्रारूप-विशिष्ट गुण (जैसे, छवियों के लिए EXIF, वीडियो के लिए कोडेक्स, आदि) निकालता है।
- केवल पढ़ने के लिए संचालन: मूल फ़ाइल को संशोधित किए बिना मेटाडेटा को पढ़ने और निरीक्षण करने पर ध्यान केंद्रित करता है।
- फ़ाइल प्रकार अज्ञेयवादी: स्वचालित रूप से फ़ाइल प्रकारों का पता लगाता है और तदनुसार मेटाडेटा निकालता है।
- एकीकरण: सामग्री संगठन, डिजिटल फोरेंसिक और अभिलेखीय प्रणालियों जैसे वर्कफ़्लो में उपयोग के लिए पायथन अनुप्रयोगों में एकीकृत किया जा सकता है।
hachoir-मेटाडाटा API के मोड
- क्लासिक मोड: मेटाडेटा निकालें, आप प्रदर्शित की जाने वाली जानकारी की मात्रा को सीमित करने के लिए –level=LEVEL का उपयोग कर सकते हैं (और निकालने के लिए नहीं)
- type: एक पंक्ति में फ़ाइल प्रारूप और सबसे महत्वपूर्ण जानकारी दिखाएं
- mime: केवल फ़ाइल MIME प्रकार प्रदर्शित करें
पायथन के लिए Hachoir API के साथ आरंभ करना
Python के लिए Hachoir API का उपयोग करने के लिए, आपको अपने सिस्टम पर Python 3.6+ संस्करण और Hachoir इंस्टॉल करना होगा। इसलिए, पहले Python इंस्टॉल करें और फिर pip और वर्चुअल एनवायरनमेंट का उपयोग करके अपनी मशीन पर Hachoir API इंस्टॉल करने के लिए नीचे दिए गए कमांड का उपयोग करें।
pip install hachoir
1. Checkout the source code from Github repository git clone git://github.com/vstinner/hachoir.git
2. Run setup.py to install the module from source python setup.py install [--user|--prefix=]
पायथन के लिए hachoir-metadata API के साथ कार्य करना - उदाहरण
पायथन के लिए hachoir-metadata API आपको मीडिया फ़ाइल प्रकारों से मेटाडेटा जानकारी पढ़ने देता है। कोड की सिर्फ़ कुछ पंक्तियों के साथ, आप शक्तिशाली एप्लिकेशन विकसित कर सकते हैं जो विभिन्न फ़ाइल स्वरूपों से मेटाडेटा जानकारी पढ़ सकते हैं। निम्नलिखित कोड नमूने दिखाते हैं कि पायथन अनुप्रयोगों में hachoir-metadata API का उपयोग कैसे किया जा सकता है।
पायथन के लिए hachoir-metadata API के साथ कार्य करना - उदाहरण
pyExifTool आपको PDF, BMP, JPEG, DOCX, XLSX और कई अन्य फ़ाइल स्वरूपों के मेटाडेटा को पढ़ने के लिए सहायता प्रदान करता है। API आपको get_metadata विधि का उपयोग करके किसी फ़ाइल की मेटाडेटा जानकारी पढ़ने देता है। नीचे दिए गए कोड स्निपेट को देखें जहाँ हम PDF फ़ाइल से मेटाडेटा जानकारी पढ़ते हैं।
उत्पादन
जब आप इस कोड को निष्पादित करेंगे, तो आउटपुट कुछ इस प्रकार होगा (आपके नमूना फ़ाइल में उपलब्ध जानकारी के आधार पर):
Metadata:
- Duration: 1 min 56 sec 261 ms
- Image width: 1280 pixels
- Image height: 720 pixels
- Creation date: 1904-01-01 00:00:00
- Last modification: 1904-01-01 00:00:00
- Comment: Play speed: 100.0%
- Comment: User volume: 100.0%
- MIME type: video/mp4
- Endianness: Big endian
निष्कर्ष
hachoir-metadata API कई तरह के फ़ाइल फ़ॉर्मेट से मेटाडेटा निकालने के लिए एक शक्तिशाली लेकिन हल्का समाधान प्रदान करता है, जो इसे डिजिटल फ़ोरेंसिक्स, कंटेंट मैनेजमेंट और डेटा विश्लेषण जैसे क्षेत्रों में काम करने वाले पायथन डेवलपर्स के लिए एक बेहतरीन टूल बनाता है। बिना किसी संशोधन के फ़ाइलों को पार्स करने की इसकी क्षमता डेटा अखंडता सुनिश्चित करती है, जबकि इसका पाइथोनिक इंटरफ़ेस अनुप्रयोगों और वर्कफ़्लो में एकीकरण को सरल बनाता है। विविध फ़ाइल प्रकारों और मेटाडेटा गुणों के समर्थन के साथ, hachoir-metadata व्यक्तिगत और साथ ही पेशेवर परियोजनाओं/प्रणालियों दोनों के लिए त्वरित और कुशल मेटाडेटा निरीक्षण के लिए एक बहुमुखी विकल्प है।