Python ile Görsellerden Metin Çıkarmaya Yönelik Açık Kaynaklı Kütüphane

PyTesseract OCR'yi kullanarak basılı veya el yazısı metinleri görsellerden kolayca çıkarın.

PyTesseract API Nedir?

PyTesseract, görsellerden metin çıkarmaya yönelik güçlü bir açık kaynaklı araç olan Tesseract-OCR için bir Python wrapper’dır. Geliştiricilerin taranmış belgeleri, el yazısı notları ve görsellerdeki metinleri makine tarafından okunabilir bir formata dönüştürmesini sağlar. PyTesseract, otomasyon, veri çıkarma, belge dijitalleştirme ve optik karakter tanıma (OCR) gerektiren yapay zeka (AI) uygulamalarında yaygın olarak kullanılır.

Bu kütüphane, veri girişini otomatikleştirme, ekran görüntülerindeki metni algılama ve basılı belgeleri dijitalleştirme gibi işlemler için özellikle faydalıdır. Çok dilli destek ve gelişmiş görüntü işleme teknikleriyle PyTesseract, görsellerden metin çıkarmaya yönelik etkili ve esnek bir çözümdür.

GitHub İstatistikleri

İsim:
Dil:
Yıldızlar:
Çatallar:
Lisans:
Depo en son şu tarihte güncellendi:

PyTesseract API’nin Temel Özellikleri

Görselleri metne dönüştürme: OCR kullanarak basılı veya el yazısı metinleri çıkarın.
Çok dilli destek: Tesseract OCR modelleriyle 100’den fazla dili tanıyabilir.
Görüntü ön işleme uyumluluğu: OCR öncesinde görsellerin kalitesini artırmak için OpenCV ve PIL ile çalışır.
PDF’ten metin çıkarma: Taranmış PDF dosyalarını aranabilir metne dönüştürür.
Metni konum bilgisiyle çıkarma: Görseldeki metni ve konumunu birlikte alır.
Toplu işlem desteği: Birden fazla görseli aynı anda OCR işlemiyle analiz edebilir.
Çoklu platform desteği: Windows, macOS ve Linux işletim sistemlerinde çalışır.
Açık kaynaklı: Ücretsizdir ve topluluk tarafından desteklenir.

PyTesseract Kurulumu

PyTesseract’ı kullanmadan önce, sisteminizde Tesseract-OCR’nin kurulu olduğundan emin olun.

Kurulum Adımları

PyTesseract ve bağımlılıkları yükleyin


pip install pytesseract pillow opencv-python

Windows üzerinde Tesseract-OCR kurulumu:

Windows’ta Tesseract-OCR Kurulumu


# Tesseract’ı aşağıdaki bağlantıdan indirin:
https://github.com/UB-Mannheim/tesseract/wiki

Linux üzerinde kurulum:

Linux’ta Tesseract-OCR Kurulumu


sudo apt install tesseract-ocr

PyTesseract API Kullanarak Metin Çıkarma Örnekleri

Örnek 1: Görselden metin çıkarma

Görselden metin çıkarma


import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = Image.open("sample.png")
text = pytesseract.image_to_string(image)

print(text)

Örnek 2: Metni konum bilgisiyle çıkarma

Metni konum bilgisiyle çıkarma


import pytesseract
import cv2

image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)

for b in boxes.splitlines():
    b = b.split()
    x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)

cv2.imwrite("output.png", image)

Örnek 3: Gri tonlamalı görselden metin çıkarma

Gri tonlamalı görselden metin çıkarma


import pytesseract
import cv2

image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)

print(text)