Pilna OCR piltuve ar Keras un TensorFlow

Izmantojiet Keras-OCR vienkāršai, bet jaudīgai teksta atpazīšanai Python.

Kas ir Keras-OCR API?

Keras-OCR ir augsta līmeņa atvērtā koda Python bibliotēka, kas paredzēta optiskās rakstzīmju atpazīšanas (OCR) uzdevumu vienkāršošanai, izmantojot Keras un TensorFlow. Atšķirībā no tradicionālajām OCR sistēmām, kurām nepieciešama sarežģīta konfigurācija, Keras-OCR piedāvā pilnu risinājumu ar iepriekš apmācītiem modeļiem gan teksta noteikšanai (izmantojot CRAFT algoritmu), gan teksta atpazīšanai (izmantojot CRNN modeli). Tas ļauj izstrādātājiem ar dažām koda rindām iegūt tekstu no attēliem, skenētiem dokumentiem vai pat rokraksta piezīmēm.

Šī bibliotēka ir optimizēta reāliem lietojumiem, tostarp:

Dokumentu digitalizācija: Pārvērst papīra dokumentus vai PDF failus meklējamā tekstā
Automātiska datu ievade: Iegūt tekstu no rēķiniem, kvītīm vai formām
Pieejamības rīki: Ģenerēt alternatīvu tekstu attēliem tīmekļa lietojumprogrammās
Sociālo mediju analīze: Apstrādāt tekstu memos vai lietotāju veidotā saturā

Ar iebūvētu atbalstu batch apstrādei un izvēles GPU paātrinājumu, Keras-OCR līdzsvaro lietojamību un veiktspēju, padarot to ideālu gan prototipēšanai, gan produkcijas vidēm.

GitHub Stats

Name:
Language:
Stars:
Forks:
License:
Repository was last updated at

Keras-OCR galvenās funkcijas

Iepriekš apmācīti modeļi: Ietver CRAFT (noteicējs) un CRNN (atpazinējs) tūlītējai lietošanai
Vienkārša iestatīšana: Minimālas atkarības (Keras, TensorFlow, OpenCV)
Batch apstrāde: Vienlaicīga vairāku attēlu apstrāde efektivitātei
Pielāgota apmācība: Uzlabojiet modeļus ar saviem datu kopumiem
GPU nav obligāta: Darbojas uz CPU, bet paātrinās ar GPU
Ierobežojošo kastīšu izvade: Atgriež tekstu ar koordinātām telpiskai analīzei
Atvērtā koda: Bezmaksas, kopienas vadīta un ar MIT licenci

Instalēšana

Instalējiet Keras-OCR, izmantojot pip (nepieciešams Python 3.6+):

Instalēt Keras-OCR


pip install keras-ocr

GPU atbalstam pārliecinieties, ka ir instalēts TensorFlow ar GPU:

Instalēt TensorFlow GPU


pip install tensorflow-gpu

Koda piemēri

Zemāk ir praktiski piemēri teksta iegūšanai no attēliem, izmantojot Keras-OCR.

Keras-OCR teksta noteikšana

1. piemērs: Pamata teksta noteikšana un atpazīšana

Šis piemērs parāda, kā izmantot iepriekš apmācītu piltuvi teksta iegūšanai no attēla:

Pamata OCR piltuve


import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
images = ["receipt.jpg"]
predictions = pipeline.recognize(images)
print(predictions)

2. piemērs: Batch apstrāde

Apstrādājiet vairākus attēlus vienlaicīgi efektivitātes labad:

Batch apstrāde


import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
images = ["image1.jpg", "image2.jpg", "image3.jpg"]
batch_predictions = pipeline.recognize(images)
for prediction in batch_predictions:
    print(prediction)

3. piemērs: Ierobežojošo kastīšu vizualizācija

Uzzīmējiet noteiktās teksta kastītes uz sākotnējā attēla:

Vizualizēt rezultātus


import matplotlib.pyplot as plt
import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
image = keras_ocr.tools.read("document.jpg")
predictions = pipeline.recognize([image])
keras_ocr.tools.drawAnnotations(image, predictions[0])
plt.imshow(image)
plt.show()

Secinājumi

Keras-OCR vienkāršo teksta iegūšanu ar savu gatavu lietošanai piltuvi, padarot to par lielisku izvēli izstrādātājiem, kuriem nepieciešama ātra, precīza OCR bez sarežģītas iestatīšanas. Tā integrācija ar Keras un TensorFlow ļauj pielāgošanu, bet batch apstrāde nodrošina mērogojamību.

Neatkarīgi no tā, vai veidojat dokumentu skenerus, automatizējat datu ievadi vai analizējat sociālo mediju saturu, Keras-OCR piedāvā vieglu, bet jaudīgu risinājumu.