1. Products
  2.   Parser
  3.   Python
  4.   EasyOCR
 
  

Uzlabota optiskā rakstzīmju atpazīšana mūsdienu izaicinājumiem

Efektīvi iegūstiet tekstu no skenētiem dokumentiem, fotogrāfijām un PDF failiem

Kas ir EasyOCR?

EasyOCR ir atvērtā koda optiskās rakstzīmju atpazīšanas bibliotēka, kas izstrādāta ar mērķi iegūt tekstu no attēliem un dokumentiem. Tā balstās uz PyTorch platformu un atbalsta vairāk nekā 80 valodas. Risinājums ir īpaši piemērots:

  • Automātiskai dokumentu apstrādei
  • Rokraksta atpazīšanai
  • Attēlos esoša teksta iegūšanai

Galvenās tehniskās īpašības:

FunkcijaApraksts
Valodu atbalsts80+ valodas
Darbības ātrumsLīdz 42 lapām minūtē
PrecizitāteLīdz 98.6%

EasyOCR darbības piemērs

Kā tas strādā?

  1. Teksta atrašana attēlā
  2. Rakstzīmju atpazīšana
  3. Teksta struktūras atjaunošana
GitHub

GitHub Stats

Name:
Language:
Stars:
Forks:
License:
Repository was last updated at

Instalēšana un iestatīšana

Minimālās sistēmas prasības

  • Python 3.6+
  • 4GB RAM (8GB ieteicams)
  • NVIDIA GPU (neobligāts)

Instalēšanas komandas

Pamata instalēšana


pip install easyocr

Ar GPU atbalstu


pip install easyocr torch torchvision

Lietošanas piemēri

Teksta iegūšana no attēla


import easyocr
reader = easyocr.Reader(['lv'])
results = reader.readtext('attels.png')
print(results)

Dokumentu apstrāde


from easyocr import Reader
import cv2

def process_document(file_path):
    reader = Reader(['lv','en'])
    img = cv2.imread(file_path)
    return reader.readtext(img)

Veiktspējas optimizācija

Lietderīgi padomi

  • Izmantojiet GPU, lai paātrinātu apstrādi
  • Ierobežojiet nepieciešamo valodu skaitu
  • Pielāgojiet attēlu kvalitāti pirms apstrādes

Similar Products

 Latvian