Pustaka Python Sumber Terbuka untuk Ekstrak Teks daripada Imej
Gunakan PyTesseract OCR untuk mengekstrak teks bercetak dan tulisan tangan dengan mudah daripada imej.
Apakah PyTesseract API untuk Python?
PyTesseract ialah pembalut Python untuk Tesseract-OCR, alat sumber terbuka yang berkuasa untuk mengekstrak teks daripada imej. Ia membolehkan pembangun menukar dokumen yang diimbas, nota tulisan tangan, dan teks dalam imej ke format yang boleh dibaca mesin dengan usaha yang minimum. PyTesseract digunakan secara meluas dalam automasi, pengekstrakan data, pendigitalan dokumen, dan aplikasi kecerdasan buatan (AI) yang memerlukan pengecaman aksara optik (OCR).
Pustaka ini sangat berguna untuk mengautomasi input data, mengenal pasti teks daripada tangkapan skrin, dan mendigitalkan dokumen bercetak. Dengan sokongan pelbagai bahasa dan teknik pemprosesan imej, PyTesseract menyediakan penyelesaian yang cekap dan fleksibel untuk mengekstrak teks daripada imej.
Ciri Utama PyTesseract API
- Penukaran imej ke teks: Mengekstrak teks bercetak atau tulisan tangan daripada imej menggunakan OCR.
- Sokongan pelbagai bahasa: Mengenal pasti lebih daripada 100 bahasa menggunakan model Tesseract OCR.
- Keserasian prapemprosesan: Bekerja dengan OpenCV dan PIL untuk meningkatkan kualiti imej sebelum OCR.
- Ekstrak teks daripada PDF: Menukar fail PDF yang diimbas kepada teks yang boleh dicari.
- Ekstrak teks dengan kotak sempadan: Mengekstrak teks bersama dengan lokasi dalam imej.
- Pemprosesan kelompok: Menjalankan OCR pada berbilang imej secara cekap.
- Sokongan pelbagai platform: Berfungsi pada Windows, macOS, dan Linux.
- Sumber terbuka: Percuma untuk digunakan dengan sokongan komuniti.
Pemasangan PyTesseract
Sebelum menggunakan PyTesseract, pastikan bahawa Tesseract-OCR telah dipasang pada sistem anda.
Arahan Pemasangan
Pasang PyTesseract dan kebergantungan yang diperlukan
pip install pytesseract pillow opencv-python
Pemasangan Tesseract-OCR di Windows:
Pemasangan Tesseract-OCR (Windows)
# Muat turun Tesseract dari:
https://github.com/UB-Mannheim/tesseract/wiki
Pemasangan di Linux:
Pemasangan Tesseract-OCR (Linux)
sudo apt install tesseract-ocr
Contoh Kod untuk Ekstrak Teks Menggunakan PyTesseract API
Contoh 1: Mengekstrak teks daripada imej
Mengekstrak teks daripada imej
import pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
image = Image.open("sample.png")
text = pytesseract.image_to_string(image)
print(text)
Contoh 2: Mengekstrak teks dengan kotak sempadan
Mengekstrak teks dengan kotak sempadan
import pytesseract
import cv2
image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)
for b in boxes.splitlines():
b = b.split()
x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)
cv2.imwrite("output.png", image)
Contoh 3: Mengekstrak teks daripada imej skala kelabu
Mengekstrak teks daripada imej skala kelabu
import pytesseract
import cv2
image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)
print(text)