ओपन सोर्स पायथन पीडीएफ मर्जर लाइब्रेरी
इस उपयोगकर्ता-अनुकूल, ओपन-सोर्स पायथन लाइब्रेरी को आज़माएं जो आपको आसानी से पृष्ठों को विभाजित करने, जोड़ने, घुमाने, स्वैप करने और हटाने की अनुमति देता है, जिससे यह आपकी पीडीएफ दस्तावेज़ आवश्यकताओं के लिए एक बहुमुखी उपकरण बन जाता है।
PyMuPDF क्या है?
PyMuPDF, जिसे Fitz के नाम से भी जाना जाता है, एक ओपन-सोर्स पायथन लाइब्रेरी है जो PDF फ़ाइलों के साथ काम करने के लिए उपकरणों का एक व्यापक सेट प्रदान करती है। PyMuPDF के साथ, उपयोगकर्ता कुशलतापूर्वक PDF खोलने, टेक्स्ट और छवियों को निकालने, रोटेशन और क्रॉपिंग जैसे पेज गुणों में हेरफेर करने, नए PDF दस्तावेज़ बनाने और PDF पृष्ठों को छवियों में बदलने जैसे कार्य कर सकते हैं।
PyMuPDF कई सुविधाओं का समर्थन करता है। हालाँकि, इस समीक्षा में हमारा प्राथमिक ध्यान लाइब्रेरी की PDF विभाजन, विलय और पृष्ठ प्रबंधन सुविधाओं पर होगा। निष्कर्षण और पार्सिंग क्षमताओं के गहन मूल्यांकन के लिए, कृपया यहाँ क्लिक करें।
PyMuPDF के साथ आरंभ करना
PyMuPDF को इंस्टॉल और उपयोग करने के लिए आपको Python संस्करण 3.8.0 या उच्चतर की आवश्यकता है। इसलिए, पहले Python इंस्टॉल करें और फिर pip और वर्चुअल एनवायरनमेंट का उपयोग करके अपनी मशीन पर PyMuPDF इंस्टॉल करने के लिए नीचे दिए गए कमांड का उपयोग करें।
लिनक्स
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
मैक ओएस
python -m venv pymupdf-venv
. pymupdf-venv/bin/activate
pip install pymupdf
विंडोज़
python -m venv pymupdf-venv
.\pymupdf-venv\Scripts\activate
pip install pymupdf
एकाधिक PDF को एक में जोड़ें
PyMuPDF लाइब्रेरी का उपयोग करके, हम Python में कई PDF को एक ही PDF फ़ाइल में जोड़ सकते हैं। निम्न कोड स्निपेट दो PDF दस्तावेज़ों को एक के बाद एक जोड़कर एक नए दस्तावेज़ के रूप में सहेजता है:
पीडीएफ को कई फाइलों में विभाजित करें
PyMuPDF लाइब्रेरी का उपयोग करके Python में PDF दस्तावेज़ को कई PDF में विभाजित करना भी संभव है। निम्न कोड स्निपेट दस्तावेज़ के पहले दो पृष्ठों को विभाजित करता है और उन्हें एक अलग PDF के रूप में संग्रहीत करता है:
पीडीएफ पेज घुमाएँ
हम PyMuPDF लाइब्रेरी का उपयोग करके PDF फ़ाइल के पृष्ठों को घुमा भी सकते हैं। हम नीचे दिए गए कोड स्निपेट में पृष्ठों को घुमाने के लिए set_rotation फ़ंक्शन का उपयोग करेंगे:
उत्पादन
जैसा कि हम देख सकते हैं, दस्तावेज़ 90 डिग्री से घूम गया है।
पीडीएफ पृष्ठ हटाएं
PyMuPDF का उपयोग PDF फ़ाइल के पृष्ठों को हटाने के लिए भी किया जा सकता है। हम पृष्ठों को हटाने के लिए delete_page फ़ंक्शन का उपयोग करेंगे। निम्नलिखित दस्तावेज़ है जो इनपुट है और कोड इसका दूसरा पृष्ठ हटा देगा:
उत्पादन
नीचे दी गई छवि संशोधित पीडीएफ फाइल को प्रदर्शित करती है, जिसमें से दूसरा पृष्ठ हटा दिया गया है।
निष्कर्ष
PyMuPDF में PDF दस्तावेज़ों के भीतर मर्जिंग और पेज मैनिपुलेशन में उल्लेखनीय ताकत है। पृष्ठों को घुमाने, क्रॉप करने, आकार बदलने और हटाने में इसकी लचीलापन और दक्षता इसे PDF संशोधन कार्यों के लिए एक मजबूत विकल्प बनाती है। इसके अतिरिक्त, PyMuPDF की कई PDF दस्तावेज़ों को सहजता से मर्ज करने की क्षमता एक उल्लेखनीय लाभ है।
हालाँकि, इसका अपेक्षाकृत जटिल API नए लोगों के लिए सीखने की अवस्था प्रस्तुत कर सकता है, और अत्यधिक बड़े या जटिल PDF को संभालने में कुछ सीमाएँ हो सकती हैं, जो प्रदर्शन को प्रभावित कर सकती हैं। फिर भी, इन क्षेत्रों में इसकी व्यापक क्षमताएँ इसे PDF सामग्री पर सटीक नियंत्रण चाहने वालों के लिए एक मूल्यवान उपकरण बनाती हैं।