Pilna OCR piltuve ar Keras un TensorFlow
Izmantojiet Keras-OCR vienkāršai, bet jaudīgai teksta atpazīšanai Python.
Kas ir Keras-OCR API?
Keras-OCR ir augsta līmeņa atvērtā koda Python bibliotēka, kas paredzēta optiskās rakstzīmju atpazīšanas (OCR) uzdevumu vienkāršošanai, izmantojot Keras un TensorFlow. Atšķirībā no tradicionālajām OCR sistēmām, kurām nepieciešama sarežģīta konfigurācija, Keras-OCR piedāvā pilnu risinājumu ar iepriekš apmācītiem modeļiem gan teksta noteikšanai (izmantojot CRAFT algoritmu), gan teksta atpazīšanai (izmantojot CRNN modeli). Tas ļauj izstrādātājiem ar dažām koda rindām iegūt tekstu no attēliem, skenētiem dokumentiem vai pat rokraksta piezīmēm.
Šī bibliotēka ir optimizēta reāliem lietojumiem, tostarp:
- Dokumentu digitalizācija: Pārvērst papīra dokumentus vai PDF failus meklējamā tekstā
- Automātiska datu ievade: Iegūt tekstu no rēķiniem, kvītīm vai formām
- Pieejamības rīki: Ģenerēt alternatīvu tekstu attēliem tīmekļa lietojumprogrammās
- Sociālo mediju analīze: Apstrādāt tekstu memos vai lietotāju veidotā saturā
Ar iebūvētu atbalstu batch apstrādei un izvēles GPU paātrinājumu, Keras-OCR līdzsvaro lietojamību un veiktspēju, padarot to ideālu gan prototipēšanai, gan produkcijas vidēm.
Keras-OCR galvenās funkcijas
- Iepriekš apmācīti modeļi: Ietver CRAFT (noteicējs) un CRNN (atpazinējs) tūlītējai lietošanai
- Vienkārša iestatīšana: Minimālas atkarības (Keras, TensorFlow, OpenCV)
- Batch apstrāde: Vienlaicīga vairāku attēlu apstrāde efektivitātei
- Pielāgota apmācība: Uzlabojiet modeļus ar saviem datu kopumiem
- GPU nav obligāta: Darbojas uz CPU, bet paātrinās ar GPU
- Ierobežojošo kastīšu izvade: Atgriež tekstu ar koordinātām telpiskai analīzei
- Atvērtā koda: Bezmaksas, kopienas vadīta un ar MIT licenci
Instalēšana
Instalējiet Keras-OCR, izmantojot pip (nepieciešams Python 3.6+):
Instalēt Keras-OCR
pip install keras-ocr
GPU atbalstam pārliecinieties, ka ir instalēts TensorFlow ar GPU:
Instalēt TensorFlow GPU
pip install tensorflow-gpu
Koda piemēri
Zemāk ir praktiski piemēri teksta iegūšanai no attēliem, izmantojot Keras-OCR.
1. piemērs: Pamata teksta noteikšana un atpazīšana
Šis piemērs parāda, kā izmantot iepriekš apmācītu piltuvi teksta iegūšanai no attēla:
Pamata OCR piltuve
import keras_ocr
pipeline = keras_ocr.pipeline.Pipeline()
images = ["receipt.jpg"]
predictions = pipeline.recognize(images)
print(predictions)
2. piemērs: Batch apstrāde
Apstrādājiet vairākus attēlus vienlaicīgi efektivitātes labad:
Batch apstrāde
import keras_ocr
pipeline = keras_ocr.pipeline.Pipeline()
images = ["image1.jpg", "image2.jpg", "image3.jpg"]
batch_predictions = pipeline.recognize(images)
for prediction in batch_predictions:
print(prediction)
3. piemērs: Ierobežojošo kastīšu vizualizācija
Uzzīmējiet noteiktās teksta kastītes uz sākotnējā attēla:
Vizualizēt rezultātus
import matplotlib.pyplot as plt
import keras_ocr
pipeline = keras_ocr.pipeline.Pipeline()
image = keras_ocr.tools.read("document.jpg")
predictions = pipeline.recognize([image])
keras_ocr.tools.drawAnnotations(image, predictions[0])
plt.imshow(image)
plt.show()
Secinājumi
Keras-OCR vienkāršo teksta iegūšanu ar savu gatavu lietošanai piltuvi, padarot to par lielisku izvēli izstrādātājiem, kuriem nepieciešama ātra, precīza OCR bez sarežģītas iestatīšanas. Tā integrācija ar Keras un TensorFlow ļauj pielāgošanu, bet batch apstrāde nodrošina mērogojamību.
Neatkarīgi no tā, vai veidojat dokumentu skenerus, automatizējat datu ievadi vai analizējat sociālo mediju saturu, Keras-OCR piedāvā vieglu, bet jaudīgu risinājumu.
Similar Products
- EasyOCR API – Visaptveroša optiskā rakstzīmju atpazīšana (OCR) Python vidē
- pdfminer.six Python bibliotēka | Izvilkt tekstu no PDF failiem
- PyMuPDF Python API | Uzlabota PDF parsēšana un ekstrakcija
- pypdf | Python bibliotēka efektīvai PDF parsēšanai
- PyTesseract API – Teksta iegūšana no attēliem, izmantojot Python