Отворен код Python библиотека за извличане на текст от изображения
Използвайте PyTesseract OCR за лесно извличане на печатен и ръкописен текст от изображения.
Какво е PyTesseract API за Python?
PyTesseract е Python обвивка за Tesseract-OCR, мощен инструмент с отворен код за извличане на текст от изображения. Той позволява на разработчиците да конвертират сканирани документи, ръкописни бележки и текст от изображения в машинночитаем формат с минимални усилия. PyTesseract се използва широко в автоматизацията, извличането на данни, дигитализацията на документи и приложения с изкуствен интелект, които разчитат на оптично разпознаване на символи (OCR).
Библиотеката е особено полезна за автоматизиране на въвеждането на данни, разпознаване на текст от екранни снимки и дигитализация на печатни документи. С поддръжка на множество езици и техники за предварителна обработка на изображения, PyTesseract предлага ефективно и гъвкаво решение за извличане на текст от изображения.
Ключови характеристики на PyTesseract API
- Конвертиране на изображения в текст: Извличане на печатен или ръкописен текст от изображения чрез OCR.
- Поддръжка на множество езици: Разпознава над 100 езика с помощта на Tesseract OCR модели.
- Съвместимост с предварителна обработка: Работи с OpenCV и PIL за подобряване на изображенията преди OCR.
- Извличане на текст от PDF файлове: Конвертиране на сканирани PDF файлове в текстов формат.
- Извличане на текст с координати: Извличане на текст с определяне на неговите позиции.
- Обработка на множество файлове: Ефективно извършване на OCR върху няколко изображения.
- Кросплатформена съвместимост: Работи на Windows, macOS и Linux.
- Отворен код: Безплатен за използване и поддържан от общността.
Инсталиране на PyTesseract API
Преди да използвате PyTesseract, уверете се, че сте инсталирали Tesseract-OCR на вашата система.
Инсталиране
Инсталиране на PyTesseract и зависимости
pip install pytesseract pillow opencv-python
Инсталиране на Tesseract-OCR в Windows:
Инсталиране на Tesseract-OCR (Windows)
# Изтеглете Tesseract от:
https://github.com/UB-Mannheim/tesseract/wiki
В Linux, използвайте:
Инсталиране на Tesseract-OCR (Linux)
sudo apt install tesseract-ocr
Примери за извличане на текст с PyTesseract API
Пример 1: Извличане на текст от изображение
Извличане на текст от изображение
import pytesseract
from PIL import Image
image = Image.open("sample.png")
text = pytesseract.image_to_string(image)
print(text)
Пример 2: Извличане на текст с координати
Извличане на текст с координати
import pytesseract
import cv2
image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)
for b in boxes.splitlines():
b = b.split()
x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)
cv2.imwrite("output.png", image)
Пример 3: Извличане на текст от сива скала
Извличане на текст от сива скала
import pytesseract
import cv2
image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)
print(text)