ओपन सोर्स पायथन पीडीएफ पार्सर लाइब्रेरी

पीडीएफ दस्तावेज़ों से पाठ, छवियों, तालिकाओं और अन्य सामग्री को पार्स करने, पढ़ने और निकालने के लिए इस मुफ़्त और ओपन सोर्स पायथन लाइब्रेरी को आज़माएँ।

PyMuPDF क्या है?

PyMuPDF, जिसे फिट्ज़ के नाम से भी जाना जाता है, एक ओपन-सोर्स पायथन लाइब्रेरी है जो पीडीएफ फाइलों के साथ काम करने के लिए उपकरणों का एक व्यापक सेट प्रदान करता है। PyMuPDF के साथ, उपयोगकर्ता कुशलतापूर्वक पीडीएफ खोलने, टेक्स्ट, छवियों और तालिकाओं को निकालने, रोटेशन और क्रॉपिंग जैसे पेज गुणों में हेरफेर करने, नए पीडीएफ दस्तावेज़ बनाने और पीडीएफ पेजों को छवियों में परिवर्तित करने जैसे कार्य कर सकते हैं।

PyMuPDF कई सुविधाओं का समर्थन करता है जो नीचे सूचीबद्ध हैं:

  • पीडीएफ दस्तावेज़ पढ़ना: PyMuPDF पीडीएफ दस्तावेजों को खोल और पढ़ सकता है, जिससे आप उनमें मौजूद पाठ, छवियों और अन्य सामग्री तक पहुंच सकते हैं।
  • पाठ निकालना: आप पाठ सामग्री, फ़ॉन्ट और लेआउट जानकारी सहित पीडीएफ दस्तावेज़ों से पाठ निकाल सकते हैं।
  • छवि निष्कर्षण: आप पीडीएफ दस्तावेज़ों से जेपीईजी या पीएनजी जैसे विभिन्न प्रारूपों में छवियां निकाल सकते हैं।
  • टेबल एक्सट्रैक्शन: आप पीडीएफ दस्तावेज़ों से टेबल भी निकाल सकते हैं।

इस समीक्षा में, हमारा प्राथमिक ध्यान लाइब्रेरी की निष्कर्षण और पार्सिंग सुविधाओं पर होगा। विभाजन, विलय और पृष्ठ प्रबंधन सुविधाओं के गहन मूल्यांकन के लिए, कृपया यहां क्लिक करें

GitHub

गिटहब आँकड़े

नाम:
भाषा:
सितारे:
कांटे:
लाइसेंस:
रिपॉजिटरी को अंतिम बार अद्यतन किया गया था

PyMuPDF के साथ शुरुआत करना

PyMuPDF को स्थापित और उपयोग करने के लिए आपको Python संस्करण 3.8.0 या उच्चतर की आवश्यकता है। तो, पहले Python इंस्टॉल करें और फिर