Uzlabota optiskā rakstzīmju atpazīšana mūsdienu izaicinājumiem

Efektīvi iegūstiet tekstu no skenētiem dokumentiem, fotogrāfijām un PDF failiem

Kas ir EasyOCR?

EasyOCR ir atvērtā koda optiskās rakstzīmju atpazīšanas bibliotēka, kas izstrādāta ar mērķi iegūt tekstu no attēliem un dokumentiem. Tā balstās uz PyTorch platformu un atbalsta vairāk nekā 80 valodas. Risinājums ir īpaši piemērots:

Automātiskai dokumentu apstrādei
Rokraksta atpazīšanai
Attēlos esoša teksta iegūšanai

Galvenās tehniskās īpašības:

Funkcija	Apraksts
Valodu atbalsts	80+ valodas
Darbības ātrums	Līdz 42 lapām minūtē
Precizitāte	Līdz 98.6%

EasyOCR darbības piemērs

Kā tas strādā?

Teksta atrašana attēlā
Rakstzīmju atpazīšana
Teksta struktūras atjaunošana

GitHub Stats

Name:
Language:
Stars:
Forks:
License:
Repository was last updated at

Instalēšana un iestatīšana

Minimālās sistēmas prasības

Python 3.6+
4GB RAM (8GB ieteicams)
NVIDIA GPU (neobligāts)

Instalēšanas komandas

Pamata instalēšana


pip install easyocr

Ar GPU atbalstu


pip install easyocr torch torchvision

Lietošanas piemēri

Teksta iegūšana no attēla


import easyocr
reader = easyocr.Reader(['lv'])
results = reader.readtext('attels.png')
print(results)

Dokumentu apstrāde


from easyocr import Reader
import cv2

def process_document(file_path):
    reader = Reader(['lv','en'])
    img = cv2.imread(file_path)
    return reader.readtext(img)

Veiktspējas optimizācija

Lietderīgi padomi

Izmantojiet GPU, lai paātrinātu apstrādi
Ierobežojiet nepieciešamo valodu skaitu
Pielāgojiet attēlu kvalitāti pirms apstrādes