תהליך OCR מלא עם Keras ו-TensorFlow

השתמש ב-Keras-OCR לזיהוי טקסט פשוט אך חזק ב-Python.

מה זה Keras-OCR API?

Keras-OCR היא ספריית Python בקוד פתוח המיועדת לפשט משימות זיהוי תווים אופטי (OCR) באמצעות Keras ו-TensorFlow. בשונה ממערכות OCR מסורתיות הדורשות תצורה מורכבת, Keras-OCR מציעה תהליך מלא עם מודלים מאומנים מראש עבור זיהוי טקסט (באמצעות אלגוריתם CRAFT) וזיהוי תווים (דרך מודל CRNN). השילוב הזה מאפשר למפתחים לחלץ טקסט מתמונות, מסמכים סרוקים או אפילו הערות כתובות ידנית עם כמה שורות קוד בלבד.

הספרייה מותאמת למקרי שימוש בעולם האמיתי, כולל:

דיגיטציה של מסמכים: המרת מסמכי נייר או PDF לטקסט ברור.
הזנת נתונים אוטומטית: חילוץ טקסט מחשבוניות, קבלות או טפסים.
כלי נגישות: יצירת טקסט חלופי לתמונות ביישומי אינטרנט.
ניתוח מדיה חברתית: עיבוד טקסט המוטמע בממים או בתוכן שנוצר על ידי משתמשים.

עם תמיכה מובנית בעיבוד קבוצתי ותאוצה אופציונלית באמצעות GPU, Keras-OCR מאזן בין קלות שימוש לביצועים, מה שהופך אותו לאידיאלי הן לאבות טיפוס והן לפריסה בתפוקה גבוהה.

סטטיסטיקות GitHub

שֵׁם:
שפה:
כוכבים:
מזלגות:
רישיון:
המאגר עודכן לאחרונה ב

תכונות עיקריות של Keras-OCR

מודלים מאומנים מראש: כולל את CRAFT (לגילוי) ו-CRNN (לזיהוי) לשימוש מיידי.
התקנה קלה: תלות מינימלית (Keras, TensorFlow, OpenCV).
עיבוד קבוצתי: עיבוד מספר תמונות במקביל ליעילות.
אימון מותאם: כוונ� מודלים על מערכי נתונים משלך.
ללא צורך ב-GPU: רץ על CPU אך מאיץ עם GPU.
פלט של תיבות גבול: מחזיר טקסט עם קואורדינטות לניתוח מרחבי.
קוד פתוח: חינמי, מונע על ידי הקהילה ובעל רישיון MIT.

התקנה

התקן את Keras-OCR דרך pip (דורש Python 3.6+):

התקנת Keras-OCR


pip install keras-ocr

לתמיכה ב-GPU, ודא ש-TensorFlow עם GPU מותקן:

התקנת TensorFlow GPU


pip install tensorflow-gpu

דוגמאות קוד

להלן דוגמאות מעשיות לחילוץ טקסט מתמונות באמצעות Keras-OCR.

זיהוי טקסט ב-Keras-OCR

דוגמה 1: זיהוי וזיהוי טקסט בסיסי

דוגמה זו מראה כיצד להשתמש בתהליך המאומן מראש כדי לחלץ טקסט מתמונה:

תהליך OCR בסיסי


import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
images = ["receipt.jpg"]
predictions = pipeline.recognize(images)
print(predictions)

דוגמה 2: עיבוד קבוצתי

עבד מספר תמונות בבת אחת ליעילות:

עיבוד קבוצתי


import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
images = ["image1.jpg", "image2.jpg", "image3.jpg"]
batch_predictions = pipeline.recognize(images)
for prediction in batch_predictions:
    print(prediction)

דוגמה 3: הדמיית תיבות גבול

צייר תיבות טקסט מזוהות על התמונה המקורית:

הדמיית תוצאות


import matplotlib.pyplot as plt
import keras_ocr

pipeline = keras_ocr.pipeline.Pipeline()
image = keras_ocr.tools.read("document.jpg")
predictions = pipeline.recognize([image])
keras_ocr.tools.drawAnnotations(image, predictions[0])
plt.imshow(image)
plt.show()

סיכום

Keras-OCR מפשט את חילוץ הטקסט עם התהליך המוכן לשימוש שלו, מה שהופך אותו לבחירה מצוינת עבור מפתחים הזקוקים ל-OCR מהיר ומדויק ללא תצורה מורכבת. השילוב עם Keras ו-TensorFlow מאפשר התאמה אישית, בעוד שעיבוד קבוצתי מבטיח מדרגיות.

בין אם אתה בונה סורקי מסמכים, ממכן הזנת נתונים או מנתח תוכן מדיה חברתית, Keras-OCR מספק פתרון קל משקל אך חזק.