छवियों से पाठ निकालने के लिए ओपन-सोर्स पायथन लाइब्रेरी
PyTesseract OCR का उपयोग करके मुद्रित और हस्तलिखित पाठ को आसानी से निकालें।
PyTesseract API क्या है?
PyTesseract, Tesseract-OCR के लिए एक पायथन रैपर है, जो छवियों से पाठ निकालने के लिए एक शक्तिशाली ओपन-सोर्स टूल है। यह डेवलपर्स को स्कैन किए गए दस्तावेज़ों, हस्तलिखित नोट्स और छवियों में निहित पाठ को न्यूनतम प्रयास के साथ मशीन-पठनीय प्रारूप में परिवर्तित करने की अनुमति देता है। PyTesseract का व्यापक रूप से स्वचालन, डेटा निष्कर्षण, दस्तावेज़ डिजिटलीकरण और उन एआई-आधारित अनुप्रयोगों में उपयोग किया जाता है जिन्हें ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) की आवश्यकता होती है।
यह लाइब्रेरी विशेष रूप से डेटा इनपुट को स्वचालित करने, स्क्रीनशॉट से पाठ पहचानने और मुद्रित दस्तावेज़ों को डिजिटाइज़ करने के लिए उपयोगी है। बहुभाषी समर्थन और छवि प्रसंस्करण तकनीकों के साथ, PyTesseract छवियों से पाठ निकालने के लिए एक कुशल और लचीला समाधान प्रदान करता है।
PyTesseract API की मुख्य विशेषताएँ
- छवियों को पाठ में बदलना: OCR का उपयोग करके मुद्रित या हस्तलिखित पाठ निकालें।
- बहुभाषी समर्थन: Tesseract OCR मॉडल के साथ 100+ भाषाओं को पहचानता है।
- पूर्व-प्रसंस्करण संगतता: OCR से पहले छवि गुणवत्ता बढ़ाने के लिए OpenCV और PIL के साथ काम करता है।
- PDF से पाठ निकालना: स्कैन किए गए PDF को खोजने योग्य पाठ में बदलें।
- बाउंडिंग बॉक्स के साथ पाठ निकालना: पाठ के स्थान के साथ उसे निकालें।
- बैच प्रोसेसिंग: कई छवियों पर एक साथ OCR निष्पादित करें।
- मल्टी-प्लेटफ़ॉर्म समर्थन: Windows, macOS और Linux पर कार्य करता है।
- ओपन-सोर्स: मुफ़्त और समुदाय द्वारा समर्थित।
PyTesseract की स्थापना
PyTesseract का उपयोग करने से पहले, सुनिश्चित करें कि Tesseract-OCR आपके सिस्टम पर स्थापित है।
स्थापना
PyTesseract और आवश्यक पैकेज स्थापित करें
pip install pytesseract pillow opencv-python
Windows पर Tesseract-OCR स्थापित करें:
Tesseract-OCR स्थापना (Windows)
# Tesseract डाउनलोड करें:
https://github.com/UB-Mannheim/tesseract/wiki
Linux पर स्थापना:
Tesseract-OCR स्थापना (Linux)
sudo apt install tesseract-ocr
PyTesseract API का उपयोग करके पाठ निकालने के कोड उदाहरण
उदाहरण 1: एक छवि से पाठ निकालना
एक छवि से पाठ निकालें
import pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
image = Image.open("sample.png")
text = pytesseract.image_to_string(image)
print(text)
उदाहरण 2: बाउंडिंग बॉक्स के साथ पाठ निकालना
बाउंडिंग बॉक्स के साथ पाठ निकालें
import pytesseract
import cv2
image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)
for b in boxes.splitlines():
b = b.split()
x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)
cv2.imwrite("output.png", image)
उदाहरण 3: ग्रेस्केल छवि से पाठ निकालना
ग्रेस्केल छवि से पाठ निकालें
import pytesseract
import cv2
image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)
print(text)