Valmis OCR-putki Kerasilla ja TensorFlowlla

Käytä Keras-OCR:ia nopeaan ja tehokkaaseen tekstintunnistukseen Pythonissa.

Mikä on Keras-OCR API?

Keras-OCR on korkean tason avoimen lähdekoodin Python-kirjasto, joka helpottaa optisen tekstintunnistuksen (OCR) tehtäviä Kerasin ja TensorFlown avulla. Toisin kuin perinteiset OCR-järjestelmät, Keras-OCR tarjoaa valmiin ratkaisun esikoulutetuilla malleilla tekstin paikantamiseen (CRAFT-algoritmi) ja tekstin tunnistamiseen (CRNN-malli). Tämän avulla voit poimia tekstiä kuvista, skannatuista asiakirjoista tai jopa käsinkirjoituksesta muutamalla koodirivillä.

Kirjasto sopii erityisesti seuraaviin käyttötarkoituksiin:

  • Asiakirjojen digitalisointi: Muunna paperiasiakirjat tai PDF-tiedostot haettavaksi tekstiksi
  • Tietojen automaattinen käsittely: Poimi tekstiä laskuista, kuiteista tai lomakkeista
  • Saavutettavuus: Luo vaihtoehtoista tekstiä kuville verkkosovelluksissa
  • Sosiaalisen median analyysi: Käsittele meemeihin upotettua tekstiä

Eräajon ja GPU-tuen ansiosta Keras-OCR yhdistää käytön helppouden ja korkean suorituskyvyn.

GitHub

Statistiques GitHub

Nom:
Langue:
Étoiles:
Fourchettes:
Licence:
Le référentiel a été mis à jour pour la dernière fois à

Keras-OCR:n pääominaisuudet

  • Esivalmiit mallit: Sisältää CRAFT- ja CRNN-mallit
  • Helppo käyttöönotto: Vähäiset riippuvuudet
  • Eräajon tuki: Käsittele useita kuvia kerralla
  • Mukautettavuus: Kouluta malleja omilla tiedoillasi
  • GPU-tuki: Nopeuta käsittelyä grafiikkaprosessorilla
  • Tarkka paikannus: Palauttaa tekstin sijainnin
  • Avoin lähdekoodi: MIT-lisenssi ja yhteisön tuki

Asennus

Asenna Keras-OCR pip-komennolla (vaatii Python 3.6+):

Asenna Keras-OCR


pip install keras-ocr

GPU-tukea varten asenna TensorFlow GPU -versio:

Asenna TensorFlow GPU


pip install tensorflow-gpu

Käyttöesimerkkejä

Alla on käytännön esimerkkejä Keras-OCR:n käytöstä.

Keras-OCR tekstintunnistus

Esimerkki 1: Perustekstin tunnistus

Tunnista teksti kuvasta:

Tekstin tunnistus


import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
images = ["receipt.jpg"]
predictions = pipeline.recognize(images)
print(predictions)

Esimerkki 2: Usean kuvan käsittely

Käsittele useita kuvia kerralla:

Usean kuvan käsittely


import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
images = ["image1.jpg", "image2.jpg", "image3.jpg"]
batch_predictions = pipeline.recognize(images)
for prediction in batch_predictions:
    print(prediction)

Esimerkki 3: Tulosten visualisointi

Näytä tunnistetut tekstialueet kuvassa:

Visualisoi tulokset


import matplotlib.pyplot as plt
import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
image = keras_ocr.tools.read("document.jpg")
predictions = pipeline.recognize([image])
keras_ocr.tools.drawAnnotations(image, predictions[0])
plt.imshow(image)
plt.show()

Yhteenveto

Keras-OCR tarjoaa yksinkertaisen mutta tehokkaan tavan käsitellä tekstintunnistusta Pythonissa. Sen valmiit mallit ja helppo käyttöliittymä tekevät siitä erinomaisen valinnan sekä kokeiluihin että tuotantokäyttöön.

Kirjaston avulla voit automatisoida tekstin käsittelyä erilaisissa sovelluksissa ilman monimutkaista konfigurointia.

Produits Similaires

 Français