Atvērtā pirmkoda Python bibliotēka teksta iegūšanai no attēliem

Izmantojiet PyTesseract OCR, lai viegli iegūtu drukātu un ar roku rakstītu tekstu no attēliem.

Kas ir PyTesseract API Python valodā?

PyTesseract ir Python ietvars Tesseract-OCR – jaudīgam atvērtā pirmkoda rīkam, kas ļauj iegūt tekstu no attēliem. Šī bibliotēka ļauj izstrādātājiem konvertēt skenētus dokumentus, ar roku rakstītas piezīmes un attēlos esošo tekstu uz mašīnlasāmu formātu ar minimālu piepūli. PyTesseract tiek plaši izmantots automatizācijā, datu iegūšanā, dokumentu digitalizācijā un mākslīgā intelekta (AI) lietojumos, kuriem nepieciešama optiskā rakstzīmju atpazīšana (OCR).

Šī bibliotēka ir īpaši noderīga datu ievades automatizācijai, teksta atpazīšanai no ekrānuzņēmumiem un drukāto dokumentu digitalizācijai. Ar daudzvalodu atbalstu un attēlu apstrādes tehnikām PyTesseract nodrošina efektīvu un elastīgu risinājumu teksta iegūšanai no attēliem.

GitHub Stats

Name:
Language:
Stars:
Forks:
License:
Repository was last updated at

Galvenās PyTesseract API funkcijas

Attēlu konvertēšana uz tekstu: Iegūstiet drukātu vai ar roku rakstītu tekstu no attēliem, izmantojot OCR.
Daudzvalodu atbalsts: Tesseract OCR modeļi atpazīst vairāk nekā 100 valodas.
Pirmsapstrādes atbalsts: Darbojas ar OpenCV un PIL, lai uzlabotu attēlu kvalitāti pirms OCR.
Teksta iegūšana no PDF: Konvertē skenētus PDF failus uz meklējamu tekstu.
Teksta iegūšana ar apzīmējumiem: Iegūst tekstu kopā ar tā atrašanās vietu attēlā.
Vairāku attēlu apstrāde: Efektīvi apstrādā vairākus attēlus vienlaicīgi.
Daudzplatformu atbalsts: Darbojas operētājsistēmās Windows, macOS un Linux.
Atvērtā pirmkoda programmatūra: Bezmaksas lietošanai ar kopienas atbalstu.

PyTesseract instalēšana

Pirms PyTesseract izmantošanas pārliecinieties, ka jūsu sistēmā ir instalēts Tesseract-OCR.

Instalācijas process

Instalējiet PyTesseract un nepieciešamās pakotnes


pip install pytesseract pillow opencv-python

Tesseract-OCR instalēšana Windows operētājsistēmā:

Tesseract-OCR instalēšana (Windows)


# Lejupielādējiet Tesseract no:
https://github.com/UB-Mannheim/tesseract/wiki

Tesseract-OCR instalēšana Linux operētājsistēmā:

Tesseract-OCR instalēšana (Linux)


sudo apt install tesseract-ocr

PyTesseract API izmantošanas piemēri

Piemērs 1: Teksta iegūšana no attēla

Teksta iegūšana no attēla


import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = Image.open("sample.png")
text = pytesseract.image_to_string(image)

print(text)

Piemērs 2: Teksta iegūšana ar apzīmējumiem

Teksta iegūšana ar apzīmējumiem


import pytesseract
import cv2

image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)

for b in boxes.splitlines():
    b = b.split()
    x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)

cv2.imwrite("output.png", image)

Piemērs 3: Teksta iegūšana no pelēktoņu attēla

Teksta iegūšana no pelēktoņu attēla


import pytesseract
import cv2

image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)

print(text)