Valmis OCR-putki Kerasilla ja TensorFlowlla

Käytä Keras-OCR:ia nopeaan ja tehokkaaseen tekstintunnistukseen Pythonissa.

Mikä on Keras-OCR API?

Keras-OCR on korkean tason avoimen lähdekoodin Python-kirjasto, joka helpottaa optisen tekstintunnistuksen (OCR) tehtäviä Kerasin ja TensorFlown avulla. Toisin kuin perinteiset OCR-järjestelmät, Keras-OCR tarjoaa valmiin ratkaisun esikoulutetuilla malleilla tekstin paikantamiseen (CRAFT-algoritmi) ja tekstin tunnistamiseen (CRNN-malli). Tämän avulla voit poimia tekstiä kuvista, skannatuista asiakirjoista tai jopa käsinkirjoituksesta muutamalla koodirivillä.

Kirjasto sopii erityisesti seuraaviin käyttötarkoituksiin:

Asiakirjojen digitalisointi: Muunna paperiasiakirjat tai PDF-tiedostot haettavaksi tekstiksi
Tietojen automaattinen käsittely: Poimi tekstiä laskuista, kuiteista tai lomakkeista
Saavutettavuus: Luo vaihtoehtoista tekstiä kuville verkkosovelluksissa
Sosiaalisen median analyysi: Käsittele meemeihin upotettua tekstiä

Eräajon ja GPU-tuen ansiosta Keras-OCR yhdistää käytön helppouden ja korkean suorituskyvyn.

Statistiques GitHub

Nom:
Langue:
Étoiles:
Fourchettes:
Licence:
Le référentiel a été mis à jour pour la dernière fois à

Keras-OCR:n pääominaisuudet

Esivalmiit mallit: Sisältää CRAFT- ja CRNN-mallit
Helppo käyttöönotto: Vähäiset riippuvuudet
Eräajon tuki: Käsittele useita kuvia kerralla
Mukautettavuus: Kouluta malleja omilla tiedoillasi
GPU-tuki: Nopeuta käsittelyä grafiikkaprosessorilla
Tarkka paikannus: Palauttaa tekstin sijainnin
Avoin lähdekoodi: MIT-lisenssi ja yhteisön tuki

Asennus

Asenna Keras-OCR pip-komennolla (vaatii Python 3.6+):

Asenna Keras-OCR


pip install keras-ocr

GPU-tukea varten asenna TensorFlow GPU -versio:

Asenna TensorFlow GPU


pip install tensorflow-gpu

Käyttöesimerkkejä

Alla on käytännön esimerkkejä Keras-OCR:n käytöstä.

Keras-OCR tekstintunnistus

Esimerkki 1: Perustekstin tunnistus

Tunnista teksti kuvasta:

Tekstin tunnistus


import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
images = ["receipt.jpg"]
predictions = pipeline.recognize(images)
print(predictions)

Esimerkki 2: Usean kuvan käsittely

Käsittele useita kuvia kerralla:

Usean kuvan käsittely


import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
images = ["image1.jpg", "image2.jpg", "image3.jpg"]
batch_predictions = pipeline.recognize(images)
for prediction in batch_predictions:
    print(prediction)

Esimerkki 3: Tulosten visualisointi

Näytä tunnistetut tekstialueet kuvassa:

Visualisoi tulokset


import matplotlib.pyplot as plt
import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
image = keras_ocr.tools.read("document.jpg")
predictions = pipeline.recognize([image])
keras_ocr.tools.drawAnnotations(image, predictions[0])
plt.imshow(image)
plt.show()

Yhteenveto

Keras-OCR tarjoaa yksinkertaisen mutta tehokkaan tavan käsitellä tekstintunnistusta Pythonissa. Sen valmiit mallit ja helppo käyttöliittymä tekevät siitä erinomaisen valinnan sekä kokeiluihin että tuotantokäyttöön.

Kirjaston avulla voit automatisoida tekstin käsittelyä erilaisissa sovelluksissa ilman monimutkaista konfigurointia.