Open-source Python βιβλιοθήκη για εξαγωγή κειμένου από εικόνες

Χρησιμοποιήστε το PyTesseract OCR για να εξάγετε εύκολα έντυπο και χειρόγραφο κείμενο από εικόνες.

Τι είναι το PyTesseract API για την Python;

Το PyTesseract είναι ένα Python wrapper για το Tesseract-OCR, ένα ισχυρό εργαλείο ανοικτού κώδικα για εξαγωγή κειμένου από εικόνες. Επιτρέπει στους προγραμματιστές να μετατρέπουν σαρωμένα έγγραφα, χειρόγραφες σημειώσεις και κείμενο από εικόνες σε μορφή αναγνώσιμη από μηχανήματα με ελάχιστη προσπάθεια. Το PyTesseract χρησιμοποιείται ευρέως στον αυτοματισμό, την εξαγωγή δεδομένων, την ψηφιοποίηση εγγράφων και τις εφαρμογές AI που απαιτούν αναγνώριση χαρακτήρων OCR.

Η βιβλιοθήκη είναι ιδιαίτερα χρήσιμη για αυτοματοποίηση καταχώρισης δεδομένων, αναγνώριση κειμένου από στιγμιότυπα οθόνης και ψηφιοποίηση έντυπων εγγράφων. Με υποστήριξη για πολλές γλώσσες και τεχνικές επεξεργασίας εικόνας, το PyTesseract προσφέρει μια αποδοτική και ευέλικτη λύση για εξαγωγή κειμένου από εικόνες.

Στατιστικά GitHub

Ονομα:
Γλώσσα:
Αστέρια:
Πιρούνια:
Αδεια:
Το αποθετήριο ενημερώθηκε τελευταία φορά στις

Βασικά χαρακτηριστικά του PyTesseract API

Μετατροπή εικόνων σε κείμενο: Εξαγωγή έντυπου ή χειρόγραφου κειμένου από εικόνες μέσω OCR.
Υποστήριξη πολλαπλών γλωσσών: Αναγνωρίζει περισσότερες από 100 γλώσσες με τα μοντέλα του Tesseract OCR.
Συμβατότητα με προεπεξεργασία: Λειτουργεί με OpenCV και PIL για βελτίωση εικόνων πριν από την OCR.
Εξαγωγή κειμένου από PDF: Μετατρέπει σαρωμένα PDF σε αναζητήσιμο κείμενο.
Εξαγωγή κειμένου με πλαίσια περιορισμού: Εξάγει κείμενο μαζί με τη θέση του στην εικόνα.
Επεξεργασία πολλών αρχείων: Εκτελεί OCR γρήγορα σε πολλές εικόνες.
Διαλειτουργικότητα: Υποστηρίζει Windows, macOS και Linux.
Ανοικτός κώδικας: Διατίθεται δωρεάν και υποστηρίζεται από την κοινότητα.

Εγκατάσταση του PyTesseract

Πριν χρησιμοποιήσετε το PyTesseract, βεβαιωθείτε ότι το Tesseract-OCR είναι εγκατεστημένο στο σύστημά σας.

Εγκατάσταση

Εγκατάσταση του PyTesseract και των απαιτούμενων πακέτων


pip install pytesseract pillow opencv-python

Εγκατάσταση του Tesseract-OCR στα Windows:

Εγκατάσταση του Tesseract-OCR (Windows)


# Κατεβάστε το Tesseract από:
https://github.com/UB-Mannheim/tesseract/wiki

Σε Linux, εκτελέστε:

Εγκατάσταση του Tesseract-OCR (Linux)


sudo apt install tesseract-ocr

Παραδείγματα κώδικα για εξαγωγή κειμένου με το PyTesseract API

Παράδειγμα 1: Εξαγωγή κειμένου από εικόνα

Εξαγωγή κειμένου από εικόνα


import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = Image.open("sample.png")
text = pytesseract.image_to_string(image)

print(text)

Παράδειγμα 2: Εξαγωγή κειμένου με πλαίσια περιορισμού

Εξαγωγή κειμένου με πλαίσια περιορισμού


import pytesseract
import cv2

image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)

for b in boxes.splitlines():
    b = b.split()
    x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)

cv2.imwrite("output.png", image)

Παράδειγμα 3: Εξαγωγή κειμένου από γκρι κλίμακα εικόνας

Εξαγωγή κειμένου από γκρι κλίμακα εικόνας


import pytesseract
import cv2

image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)

print(text)