Sreabhadh OCR lán-chomhlánta le Keras agus TensorFlow
Úsáid Keras-OCR le haghaidh aitheantais téacs simplí ach cumhachtach i Python.
Cad é API Keras-OCR?
Is leabharlann Python ard-leibhéil foinse oscailte é Keras-OCR atá deartha chun tascanna aitheantais carachtar optúil (OCR) a shimpliú ag baint úsáide as cumhacht Keras agus TensorFlow. Murab ionann agus córais OCR traidisiúnta a éilíonn cumraíocht fhorleathan, tá sreabhadh lán-chomhlánta ag Keras-OCR le samhlacha réamh-oilte le haghaidh braite téacs (ag úsáid algartam CRAFT) agus aitheantais téacs (trí shamhall CRNN). Ligeann an comhcheangal seo d'fhorbróirí téacs a bhaint as íomhánna, doiciméid scanáilte nó fiú nótaí lámhscríofa le cúpla líne cód amháin.
Tá an leabharlann optamaithe le haghaidh úsáid fíor-shaol, lena n-áirítear:
- Digitithe doiciméad: Tiontaigh doiciméid páipéir nó PDF go téacs in-inphléite
- Uaslódáil sonraí uathoibrithe: Bain téacs as sonraisc, admháil nó foirmí
- Uirlisí inrochtana: Gine téacs malartach d'íomhánna i bhfeidhmchláir ghréasáin
- Anailís mheán sóisialta: Próiseáil téacs atá leabaithe i memes nó i gcomhábhar úsáideora
Le tacaíocht ionchlánithe le haghaidh próiseála baisc agus luasghéarú GPU roghnach, déanann Keras-OCR comhardú idir éascaíocht úsáide agus feidhmíocht, rud a fhágann go bhfuil sé idéalach le haghaidh fréamhshamhlú agus rolladh táirgeachta araon.
Gnéithe Príomha Keras-OCR
- Samhlacha réamh-oilte: Cuimsíonn CRAFT (brathadóir) agus CRNN (aitheantóir) le haghaidh úsáide láithreach
- Sochomhtháil: Spriocdhíthachtaí íosta (Keras, TensorFlow, OpenCV)
- Próiseáil baisc: Próiseáil íomhánna iolracha go comhthreomhar le haghaidh éifeachtachta
- Oiliúint saincheaptha: Mín-oil samhlacha ar do shonraí féin
- Ní gá GPU: Ritheann ar LAP ach luasghéaraíonn le GPU
- Aschur bosca teorann: Seolann sé téacs ar ais le comhordanáidí le haghaidh anailíse spásúla
- Foinse oscailte: Saor in aisce, pobal-thiomanta agus ceadúnaithe MIT
Suiteáil
Suiteáil Keras-OCR trí pip (éilíonn sé Python 3.6+):
Suiteáil Keras-OCR
pip install keras-ocr
Chun tacaíocht GPU a chinntiú, déan cinnte go bhfuil TensorFlow le GPU suiteáilte:
Suiteáil TensorFlow GPU
pip install tensorflow-gpu
Samplaí Cóid
Faoi bhun tá samplaí praiticiúla le haghaidh téacs a bhaint as íomhánna ag úsáid Keras-OCR.
Sampla 1: Braitheidhm bunúsach téacs
Taispeánann an sampla seo conas an sreabhadh réamh-oilte a úsáid chun téacs a bhaint as íomhá:
Sreabhadh OCR bunúsach
import keras_ocr
pipeline = keras_ocr.pipeline.Pipeline()
images = ["receipt.jpg"]
predictions = pipeline.recognize(images)
print(predictions)
Sampla 2: Próiseáil baisc
Próiseáil íomhánna iolracha ag an am céanna le haghaidh éifeachtachta:
Próiseáil baisc
import keras_ocr
pipeline = keras_ocr.pipeline.Pipeline()
images = ["image1.jpg", "image2.jpg", "image3.jpg"]
batch_predictions = pipeline.recognize(images)
for prediction in batch_predictions:
print(prediction)
Sampla 3: Amharc boscaí teorann
Tarraing na boscaí téacs braite ar an íomhá bhunaidh:
Amharc ar thorthaí
import matplotlib.pyplot as plt
import keras_ocr
pipeline = keras_ocr.pipeline.Pipeline()
image = keras_ocr.tools.read("document.jpg")
predictions = pipeline.recognize([image])
keras_ocr.tools.drawAnnotations(image, predictions[0])
plt.imshow(image)
plt.show()
Conclúid
Déanann Keras-OCR easpórtáil téacs a shimpliú lena shreabhadh réidh le húsáid, rud a fhágann gur rogha den scoth é d'fhorbróirí a bhfuil OCR tapa, cruinn gan cumraíocht chastach ag teastáil uathu. Ligeann a chomhtháthú le Keras agus TensorFlow saincheapadh, agus cinntíonn próiseáil baisc scálaitheacht.
Cibé an bhfuil tú ag tógáil scanóirí doiciméad, ag uathoibriú iontrála sonraí nó ag anailísiú ábhair mheán sóisialta, soláthraíonn Keras-OCR réiteach éadrom ach cumhachtach.