Python ile Görsellerden Metin Çıkarmaya Yönelik Açık Kaynaklı Kütüphane
PyTesseract OCR'yi kullanarak basılı veya el yazısı metinleri görsellerden kolayca çıkarın.
PyTesseract API Nedir?
PyTesseract, görsellerden metin çıkarmaya yönelik güçlü bir açık kaynaklı araç olan Tesseract-OCR için bir Python wrapper’dır. Geliştiricilerin taranmış belgeleri, el yazısı notları ve görsellerdeki metinleri makine tarafından okunabilir bir formata dönüştürmesini sağlar. PyTesseract, otomasyon, veri çıkarma, belge dijitalleştirme ve optik karakter tanıma (OCR) gerektiren yapay zeka (AI) uygulamalarında yaygın olarak kullanılır.
Bu kütüphane, veri girişini otomatikleştirme, ekran görüntülerindeki metni algılama ve basılı belgeleri dijitalleştirme gibi işlemler için özellikle faydalıdır. Çok dilli destek ve gelişmiş görüntü işleme teknikleriyle PyTesseract, görsellerden metin çıkarmaya yönelik etkili ve esnek bir çözümdür.
PyTesseract API’nin Temel Özellikleri
- Görselleri metne dönüştürme: OCR kullanarak basılı veya el yazısı metinleri çıkarın.
- Çok dilli destek: Tesseract OCR modelleriyle 100’den fazla dili tanıyabilir.
- Görüntü ön işleme uyumluluğu: OCR öncesinde görsellerin kalitesini artırmak için OpenCV ve PIL ile çalışır.
- PDF’ten metin çıkarma: Taranmış PDF dosyalarını aranabilir metne dönüştürür.
- Metni konum bilgisiyle çıkarma: Görseldeki metni ve konumunu birlikte alır.
- Toplu işlem desteği: Birden fazla görseli aynı anda OCR işlemiyle analiz edebilir.
- Çoklu platform desteği: Windows, macOS ve Linux işletim sistemlerinde çalışır.
- Açık kaynaklı: Ücretsizdir ve topluluk tarafından desteklenir.
PyTesseract Kurulumu
PyTesseract’ı kullanmadan önce, sisteminizde Tesseract-OCR’nin kurulu olduğundan emin olun.
Kurulum Adımları
PyTesseract ve bağımlılıkları yükleyin
pip install pytesseract pillow opencv-python
Windows üzerinde Tesseract-OCR kurulumu:
Windows’ta Tesseract-OCR Kurulumu
# Tesseract’ı aşağıdaki bağlantıdan indirin:
https://github.com/UB-Mannheim/tesseract/wiki
Linux üzerinde kurulum:
Linux’ta Tesseract-OCR Kurulumu
sudo apt install tesseract-ocr
PyTesseract API Kullanarak Metin Çıkarma Örnekleri
Örnek 1: Görselden metin çıkarma
Görselden metin çıkarma
import pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
image = Image.open("sample.png")
text = pytesseract.image_to_string(image)
print(text)
Örnek 2: Metni konum bilgisiyle çıkarma
Metni konum bilgisiyle çıkarma
import pytesseract
import cv2
image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)
for b in boxes.splitlines():
b = b.split()
x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)
cv2.imwrite("output.png", image)
Örnek 3: Gri tonlamalı görselden metin çıkarma
Gri tonlamalı görselden metin çıkarma
import pytesseract
import cv2
image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)
print(text)