Pustaka Python Sumber Terbuka untuk Ekstrak Teks daripada Imej

Gunakan PyTesseract OCR untuk mengekstrak teks bercetak dan tulisan tangan dengan mudah daripada imej.

Apakah PyTesseract API untuk Python?

PyTesseract ialah pembalut Python untuk Tesseract-OCR, alat sumber terbuka yang berkuasa untuk mengekstrak teks daripada imej. Ia membolehkan pembangun menukar dokumen yang diimbas, nota tulisan tangan, dan teks dalam imej ke format yang boleh dibaca mesin dengan usaha yang minimum. PyTesseract digunakan secara meluas dalam automasi, pengekstrakan data, pendigitalan dokumen, dan aplikasi kecerdasan buatan (AI) yang memerlukan pengecaman aksara optik (OCR).

Pustaka ini sangat berguna untuk mengautomasi input data, mengenal pasti teks daripada tangkapan skrin, dan mendigitalkan dokumen bercetak. Dengan sokongan pelbagai bahasa dan teknik pemprosesan imej, PyTesseract menyediakan penyelesaian yang cekap dan fleksibel untuk mengekstrak teks daripada imej.

Statistik GitHub

nama:
Bahasa:
Bintang:
Garpu:
Lesen:
Repositori dikemas kini terakhir pada

Ciri Utama PyTesseract API

Penukaran imej ke teks: Mengekstrak teks bercetak atau tulisan tangan daripada imej menggunakan OCR.
Sokongan pelbagai bahasa: Mengenal pasti lebih daripada 100 bahasa menggunakan model Tesseract OCR.
Keserasian prapemprosesan: Bekerja dengan OpenCV dan PIL untuk meningkatkan kualiti imej sebelum OCR.
Ekstrak teks daripada PDF: Menukar fail PDF yang diimbas kepada teks yang boleh dicari.
Ekstrak teks dengan kotak sempadan: Mengekstrak teks bersama dengan lokasi dalam imej.
Pemprosesan kelompok: Menjalankan OCR pada berbilang imej secara cekap.
Sokongan pelbagai platform: Berfungsi pada Windows, macOS, dan Linux.
Sumber terbuka: Percuma untuk digunakan dengan sokongan komuniti.

Pemasangan PyTesseract

Sebelum menggunakan PyTesseract, pastikan bahawa Tesseract-OCR telah dipasang pada sistem anda.

Arahan Pemasangan

Pasang PyTesseract dan kebergantungan yang diperlukan


pip install pytesseract pillow opencv-python

Pemasangan Tesseract-OCR di Windows:

Pemasangan Tesseract-OCR (Windows)


# Muat turun Tesseract dari:
https://github.com/UB-Mannheim/tesseract/wiki

Pemasangan di Linux:

Pemasangan Tesseract-OCR (Linux)


sudo apt install tesseract-ocr

Contoh Kod untuk Ekstrak Teks Menggunakan PyTesseract API

Contoh 1: Mengekstrak teks daripada imej

Mengekstrak teks daripada imej


import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = Image.open("sample.png")
text = pytesseract.image_to_string(image)

print(text)

Contoh 2: Mengekstrak teks dengan kotak sempadan

Mengekstrak teks dengan kotak sempadan


import pytesseract
import cv2

image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)

for b in boxes.splitlines():
    b = b.split()
    x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)

cv2.imwrite("output.png", image)

Contoh 3: Mengekstrak teks daripada imej skala kelabu

Mengekstrak teks daripada imej skala kelabu


import pytesseract
import cv2

image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)

print(text)