Volledige OCR-pijplijn met Keras en TensorFlow

Gebruik Keras-OCR voor eenvoudige maar krachtige tekstherkenning in Python.

Wat is de Keras-OCR API?

Keras-OCR is een hoogwaardige, open-source Python-bibliotheek ontworpen om optische tekenherkenning (OCR) taken te vereenvoudigen met behulp van Keras en TensorFlow. In tegenstelling tot traditionele OCR-systemen die uitgebreide configuratie vereisen, biedt Keras-OCR een complete pijplijn met vooraf getrainde modellen voor tekstdetectie (met het CRAFT-algoritme) en tekstherkenning (via een CRNN-model). Deze combinatie stelt ontwikkelaars in staat om met slechts een paar regels code tekst uit afbeeldingen, gescande documenten of zelfs handgeschreven notities te extraheren.

De bibliotheek is geoptimaliseerd voor real-world gebruiksscenario's, waaronder:

Documentdigitalisering: Converteer papieren documenten of PDF's naar doorzoekbare tekst
Geautomatiseerde gegevensinvoer: Extraheer tekst uit facturen, bonnetjes of formulieren
Toegankelijkheidshulpmiddelen: Genereer alt-tekst voor afbeeldingen in webapplicaties
Social media-analyse: Verwerk tekst ingebed in memes of door gebruikers gegenereerde content

Met ingebouwde ondersteuning voor batchverwerking en optionele GPU-versnelling biedt Keras-OCR een balans tussen gebruiksgemak en prestaties, waardoor het ideaal is voor zowel prototyping als productie-implementaties.

GitHub-statistieken

Naam:
Taal:
Sterren:
Vorken:
Licentie:
De opslagplaats is voor het laatst bijgewerkt op

Belangrijkste kenmerken van Keras-OCR

Vooraf getrainde modellen: Bevat CRAFT (detector) en CRNN (herkenner) voor direct gebruik
Eenvoudige setup: Minimale afhankelijkheden (Keras, TensorFlow, OpenCV)
Batchverwerking: Verwerk meerdere afbeeldingen parallel voor efficiëntie
Aanpasbare training: Fine-tune modellen met uw eigen datasets
Geen GPU vereist: Werkt op CPU maar versnelt met GPU
Begrenzingsvakken output: Geeft tekst terug met coördinaten voor ruimtelijke analyse
Open source: Gratis, community-gedreven en MIT-licentie

Installatie

Installeer Keras-OCR via pip (vereist Python 3.6+):

Installeer Keras-OCR


pip install keras-ocr

Voor GPU-ondersteuning, zorg dat TensorFlow met GPU is geïnstalleerd:

Installeer TensorFlow GPU


pip install tensorflow-gpu

Codevoorbeelden

Hieronder staan praktische voorbeelden voor het extraheren van tekst uit afbeeldingen met Keras-OCR.

Tekstdetectie met Keras-OCR

Voorbeeld 1: Basistekstdetectie en -herkenning

Dit voorbeeld laat zien hoe u de vooraf getrainde pijplijn kunt gebruiken om tekst uit een afbeelding te extraheren:

Basis OCR-pijplijn


import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
images = ["receipt.jpg"]
predictions = pipeline.recognize(images)
print(predictions)

Voorbeeld 2: Batchverwerking

Verwerk meerdere afbeeldingen tegelijk voor efficiëntie:

Batchverwerking


import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
images = ["image1.jpg", "image2.jpg", "image3.jpg"]
batch_predictions = pipeline.recognize(images)
for prediction in batch_predictions:
    print(prediction)

Voorbeeld 3: Visualisatie van begrenzingsvakken

Teken gedetecteerde tekstvakken op de originele afbeelding:

Visualiseer resultaten


import matplotlib.pyplot as plt
import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
image = keras_ocr.tools.read("document.jpg")
predictions = pipeline.recognize([image])
keras_ocr.tools.drawAnnotations(image, predictions[0])
plt.imshow(image)
plt.show()

Conclusie

Keras-OCR vereenvoudigt tekstextractie met zijn kant-en-klare pijplijn, waardoor het een uitstekende keuze is voor ontwikkelaars die snelle, nauwkeurige OCR nodig hebben zonder complexe configuratie. De integratie met Keras en TensorFlow maakt aanpassingen mogelijk, terwijl batchverwerking schaalbaarheid garandeert.

Of u nu documentscanners bouwt, gegevensinvoer automatiseert of social media-content analyseert, Keras-OCR biedt een lichtgewicht maar krachtige oplossing.