छवियों से पाठ निकालने के लिए ओपन-सोर्स पायथन लाइब्रेरी

PyTesseract OCR का उपयोग करके मुद्रित और हस्तलिखित पाठ को आसानी से निकालें।

PyTesseract API क्या है?

PyTesseract, Tesseract-OCR के लिए एक पायथन रैपर है, जो छवियों से पाठ निकालने के लिए एक शक्तिशाली ओपन-सोर्स टूल है। यह डेवलपर्स को स्कैन किए गए दस्तावेज़ों, हस्तलिखित नोट्स और छवियों में निहित पाठ को न्यूनतम प्रयास के साथ मशीन-पठनीय प्रारूप में परिवर्तित करने की अनुमति देता है। PyTesseract का व्यापक रूप से स्वचालन, डेटा निष्कर्षण, दस्तावेज़ डिजिटलीकरण और उन एआई-आधारित अनुप्रयोगों में उपयोग किया जाता है जिन्हें ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) की आवश्यकता होती है।

यह लाइब्रेरी विशेष रूप से डेटा इनपुट को स्वचालित करने, स्क्रीनशॉट से पाठ पहचानने और मुद्रित दस्तावेज़ों को डिजिटाइज़ करने के लिए उपयोगी है। बहुभाषी समर्थन और छवि प्रसंस्करण तकनीकों के साथ, PyTesseract छवियों से पाठ निकालने के लिए एक कुशल और लचीला समाधान प्रदान करता है।

गिटहब आँकड़े

नाम:
भाषा:
सितारे:
कांटे:
लाइसेंस:
रिपॉजिटरी को अंतिम बार अद्यतन किया गया था

PyTesseract API की मुख्य विशेषताएँ

छवियों को पाठ में बदलना: OCR का उपयोग करके मुद्रित या हस्तलिखित पाठ निकालें।
बहुभाषी समर्थन: Tesseract OCR मॉडल के साथ 100+ भाषाओं को पहचानता है।
पूर्व-प्रसंस्करण संगतता: OCR से पहले छवि गुणवत्ता बढ़ाने के लिए OpenCV और PIL के साथ काम करता है।
PDF से पाठ निकालना: स्कैन किए गए PDF को खोजने योग्य पाठ में बदलें।
बाउंडिंग बॉक्स के साथ पाठ निकालना: पाठ के स्थान के साथ उसे निकालें।
बैच प्रोसेसिंग: कई छवियों पर एक साथ OCR निष्पादित करें।
मल्टी-प्लेटफ़ॉर्म समर्थन: Windows, macOS और Linux पर कार्य करता है।
ओपन-सोर्स: मुफ़्त और समुदाय द्वारा समर्थित।

PyTesseract की स्थापना

PyTesseract का उपयोग करने से पहले, सुनिश्चित करें कि Tesseract-OCR आपके सिस्टम पर स्थापित है।

स्थापना

PyTesseract और आवश्यक पैकेज स्थापित करें


pip install pytesseract pillow opencv-python

Windows पर Tesseract-OCR स्थापित करें:

Tesseract-OCR स्थापना (Windows)


# Tesseract डाउनलोड करें:
https://github.com/UB-Mannheim/tesseract/wiki

Linux पर स्थापना:

Tesseract-OCR स्थापना (Linux)


sudo apt install tesseract-ocr

PyTesseract API का उपयोग करके पाठ निकालने के कोड उदाहरण

उदाहरण 1: एक छवि से पाठ निकालना

एक छवि से पाठ निकालें


import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = Image.open("sample.png")
text = pytesseract.image_to_string(image)

print(text)

उदाहरण 2: बाउंडिंग बॉक्स के साथ पाठ निकालना

बाउंडिंग बॉक्स के साथ पाठ निकालें


import pytesseract
import cv2

image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)

for b in boxes.splitlines():
    b = b.split()
    x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)

cv2.imwrite("output.png", image)

उदाहरण 3: ग्रेस्केल छवि से पाठ निकालना

ग्रेस्केल छवि से पाठ निकालें


import pytesseract
import cv2

image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)

print(text)