Valmis OCR-putki Kerasilla ja TensorFlowlla
Käytä Keras-OCR:ia nopeaan ja tehokkaaseen tekstintunnistukseen Pythonissa.
Mikä on Keras-OCR API?
Keras-OCR on korkean tason avoimen lähdekoodin Python-kirjasto, joka helpottaa optisen tekstintunnistuksen (OCR) tehtäviä Kerasin ja TensorFlown avulla. Toisin kuin perinteiset OCR-järjestelmät, Keras-OCR tarjoaa valmiin ratkaisun esikoulutetuilla malleilla tekstin paikantamiseen (CRAFT-algoritmi) ja tekstin tunnistamiseen (CRNN-malli). Tämän avulla voit poimia tekstiä kuvista, skannatuista asiakirjoista tai jopa käsinkirjoituksesta muutamalla koodirivillä.
Kirjasto sopii erityisesti seuraaviin käyttötarkoituksiin:
- Asiakirjojen digitalisointi: Muunna paperiasiakirjat tai PDF-tiedostot haettavaksi tekstiksi
- Tietojen automaattinen käsittely: Poimi tekstiä laskuista, kuiteista tai lomakkeista
- Saavutettavuus: Luo vaihtoehtoista tekstiä kuville verkkosovelluksissa
- Sosiaalisen median analyysi: Käsittele meemeihin upotettua tekstiä
Eräajon ja GPU-tuen ansiosta Keras-OCR yhdistää käytön helppouden ja korkean suorituskyvyn.
Keras-OCR:n pääominaisuudet
- Esivalmiit mallit: Sisältää CRAFT- ja CRNN-mallit
- Helppo käyttöönotto: Vähäiset riippuvuudet
- Eräajon tuki: Käsittele useita kuvia kerralla
- Mukautettavuus: Kouluta malleja omilla tiedoillasi
- GPU-tuki: Nopeuta käsittelyä grafiikkaprosessorilla
- Tarkka paikannus: Palauttaa tekstin sijainnin
- Avoin lähdekoodi: MIT-lisenssi ja yhteisön tuki
Asennus
Asenna Keras-OCR pip-komennolla (vaatii Python 3.6+):
Asenna Keras-OCR
pip install keras-ocr
GPU-tukea varten asenna TensorFlow GPU -versio:
Asenna TensorFlow GPU
pip install tensorflow-gpu
Käyttöesimerkkejä
Alla on käytännön esimerkkejä Keras-OCR:n käytöstä.
Esimerkki 1: Perustekstin tunnistus
Tunnista teksti kuvasta:
Tekstin tunnistus
import keras_ocr
pipeline = keras_ocr.pipeline.Pipeline()
images = ["receipt.jpg"]
predictions = pipeline.recognize(images)
print(predictions)
Esimerkki 2: Usean kuvan käsittely
Käsittele useita kuvia kerralla:
Usean kuvan käsittely
import keras_ocr
pipeline = keras_ocr.pipeline.Pipeline()
images = ["image1.jpg", "image2.jpg", "image3.jpg"]
batch_predictions = pipeline.recognize(images)
for prediction in batch_predictions:
print(prediction)
Esimerkki 3: Tulosten visualisointi
Näytä tunnistetut tekstialueet kuvassa:
Visualisoi tulokset
import matplotlib.pyplot as plt
import keras_ocr
pipeline = keras_ocr.pipeline.Pipeline()
image = keras_ocr.tools.read("document.jpg")
predictions = pipeline.recognize([image])
keras_ocr.tools.drawAnnotations(image, predictions[0])
plt.imshow(image)
plt.show()
Yhteenveto
Keras-OCR tarjoaa yksinkertaisen mutta tehokkaan tavan käsitellä tekstintunnistusta Pythonissa. Sen valmiit mallit ja helppo käyttöliittymä tekevät siitä erinomaisen valinnan sekä kokeiluihin että tuotantokäyttöön.
Kirjaston avulla voit automatisoida tekstin käsittelyä erilaisissa sovelluksissa ilman monimutkaista konfigurointia.
Produits Similaires
- API docTR – Reconnaissance Optique de Caractères en Python
- API EasyOCR - Reconnaissance optique de caractères complète en Python
- API Python PyMuPDF | Analyse et extraction avancées de PDF
- Bibliothèque Python pdfminer.six | Extraire du texte à partir de fichiers PDF
- pypdf | Bibliothèque Python pour une analyse PDF efficace