Отворен код Python библиотека за извличане на текст от изображения

Използвайте PyTesseract OCR за лесно извличане на печатен и ръкописен текст от изображения.

Какво е PyTesseract API за Python?

PyTesseract е Python обвивка за Tesseract-OCR, мощен инструмент с отворен код за извличане на текст от изображения. Той позволява на разработчиците да конвертират сканирани документи, ръкописни бележки и текст от изображения в машинночитаем формат с минимални усилия. PyTesseract се използва широко в автоматизацията, извличането на данни, дигитализацията на документи и приложения с изкуствен интелект, които разчитат на оптично разпознаване на символи (OCR).

Библиотеката е особено полезна за автоматизиране на въвеждането на данни, разпознаване на текст от екранни снимки и дигитализация на печатни документи. С поддръжка на множество езици и техники за предварителна обработка на изображения, PyTesseract предлага ефективно и гъвкаво решение за извличане на текст от изображения.

Статистика на GitHub

Име:
език:
звезди:
Вилици:
Разрешително:
Хранилището е последно актуализирано на

Ключови характеристики на PyTesseract API

Конвертиране на изображения в текст: Извличане на печатен или ръкописен текст от изображения чрез OCR.
Поддръжка на множество езици: Разпознава над 100 езика с помощта на Tesseract OCR модели.
Съвместимост с предварителна обработка: Работи с OpenCV и PIL за подобряване на изображенията преди OCR.
Извличане на текст от PDF файлове: Конвертиране на сканирани PDF файлове в текстов формат.
Извличане на текст с координати: Извличане на текст с определяне на неговите позиции.
Обработка на множество файлове: Ефективно извършване на OCR върху няколко изображения.
Кросплатформена съвместимост: Работи на Windows, macOS и Linux.
Отворен код: Безплатен за използване и поддържан от общността.

Инсталиране на PyTesseract API

Преди да използвате PyTesseract, уверете се, че сте инсталирали Tesseract-OCR на вашата система.

Инсталиране

Инсталиране на PyTesseract и зависимости


pip install pytesseract pillow opencv-python

Инсталиране на Tesseract-OCR в Windows:

Инсталиране на Tesseract-OCR (Windows)


# Изтеглете Tesseract от:
https://github.com/UB-Mannheim/tesseract/wiki

В Linux, използвайте:

Инсталиране на Tesseract-OCR (Linux)


sudo apt install tesseract-ocr

Примери за извличане на текст с PyTesseract API

Пример 1: Извличане на текст от изображение

Извличане на текст от изображение


import pytesseract
from PIL import Image
image = Image.open("sample.png")
text = pytesseract.image_to_string(image)

print(text)

Пример 2: Извличане на текст с координати

Извличане на текст с координати


import pytesseract
import cv2

image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)

for b in boxes.splitlines():
    b = b.split()
    x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)

cv2.imwrite("output.png", image)

Пример 3: Извличане на текст от сива скала

Извличане на текст от сива скала


import pytesseract
import cv2

image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)

print(text)