पीडीएफ से एचटीएमएल/एक्सएमएल रूपांतरण पायथन लाइब्रेरी
पीडीएफ दस्तावेज़ों को HTML और XML में बदलने के लिए मुफ़्त और खुला स्रोत पायथन लाइब्रेरी।
पीडीएफमिनर.सिक्स क्या है?
pdfminer.six एक स्वतंत्र और खुला स्रोत पायथन लाइब्रेरी है जिसका उपयोग पीडीएफ दस्तावेजों को अन्य प्रारूपों में परिवर्तित करने के लिए किया जा सकता है।
यहां इसकी मुख्य पीडीएफ रूपांतरण सुविधाओं की एक संक्षिप्त सूची दी गई है:
- पीडीएफ से एचटीएमएल रूपांतरण: दस्तावेज़ की संरचना और लेआउट को संरक्षित करते हुए पीडीएफ दस्तावेजों को एचटीएमएल प्रारूप में परिवर्तित करें।
- पीडीएफ से एक्सएमएल रूपांतरण: फ़ॉन्ट और अन्य तत्वों सहित सभी विवरणों को कैप्चर करते हुए पीडीएफ फाइलों को एक्सएमएल प्रारूप में बदलें।
पीडीएफमिनर.सिक्स के साथ शुरुआत करना
pypdf को स्थापित करने और उपयोग करने के लिए आपको Python संस्करण 3.6.0 या उच्चतर की आवश्यकता है। तो, पहले Python इंस्टॉल करें और फिर