Atvērtā pirmkoda Python bibliotēka teksta iegūšanai no attēliem
Izmantojiet PyTesseract OCR, lai viegli iegūtu drukātu un ar roku rakstītu tekstu no attēliem.
Kas ir PyTesseract API Python valodā?
PyTesseract ir Python ietvars Tesseract-OCR – jaudīgam atvērtā pirmkoda rīkam, kas ļauj iegūt tekstu no attēliem. Šī bibliotēka ļauj izstrādātājiem konvertēt skenētus dokumentus, ar roku rakstītas piezīmes un attēlos esošo tekstu uz mašīnlasāmu formātu ar minimālu piepūli. PyTesseract tiek plaši izmantots automatizācijā, datu iegūšanā, dokumentu digitalizācijā un mākslīgā intelekta (AI) lietojumos, kuriem nepieciešama optiskā rakstzīmju atpazīšana (OCR).
Šī bibliotēka ir īpaši noderīga datu ievades automatizācijai, teksta atpazīšanai no ekrānuzņēmumiem un drukāto dokumentu digitalizācijai. Ar daudzvalodu atbalstu un attēlu apstrādes tehnikām PyTesseract nodrošina efektīvu un elastīgu risinājumu teksta iegūšanai no attēliem.
GitHub Stats
Name: pytesseractLanguage: Python
Stars: 128
Forks: 5
License: GNU General Public License v3.0
Repository was last updated at 2025-04-04
Galvenās PyTesseract API funkcijas
- Attēlu konvertēšana uz tekstu: Iegūstiet drukātu vai ar roku rakstītu tekstu no attēliem, izmantojot OCR.
- Daudzvalodu atbalsts: Tesseract OCR modeļi atpazīst vairāk nekā 100 valodas.
- Pirmsapstrādes atbalsts: Darbojas ar OpenCV un PIL, lai uzlabotu attēlu kvalitāti pirms OCR.
- Teksta iegūšana no PDF: Konvertē skenētus PDF failus uz meklējamu tekstu.
- Teksta iegūšana ar apzīmējumiem: Iegūst tekstu kopā ar tā atrašanās vietu attēlā.
- Vairāku attēlu apstrāde: Efektīvi apstrādā vairākus attēlus vienlaicīgi.
- Daudzplatformu atbalsts: Darbojas operētājsistēmās Windows, macOS un Linux.
- Atvērtā pirmkoda programmatūra: Bezmaksas lietošanai ar kopienas atbalstu.
PyTesseract instalēšana
Pirms PyTesseract izmantošanas pārliecinieties, ka jūsu sistēmā ir instalēts Tesseract-OCR.
Instalācijas process
Instalējiet PyTesseract un nepieciešamās pakotnes
pip install pytesseract pillow opencv-python
Tesseract-OCR instalēšana Windows operētājsistēmā:
Tesseract-OCR instalēšana (Windows)
# Lejupielādējiet Tesseract no:
https://github.com/UB-Mannheim/tesseract/wiki
Tesseract-OCR instalēšana Linux operētājsistēmā:
Tesseract-OCR instalēšana (Linux)
sudo apt install tesseract-ocr
PyTesseract API izmantošanas piemēri
Piemērs 1: Teksta iegūšana no attēla
Teksta iegūšana no attēla
import pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
image = Image.open("sample.png")
text = pytesseract.image_to_string(image)
print(text)
Piemērs 2: Teksta iegūšana ar apzīmējumiem
Teksta iegūšana ar apzīmējumiem
import pytesseract
import cv2
image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)
for b in boxes.splitlines():
b = b.split()
x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)
cv2.imwrite("output.png", image)
Piemērs 3: Teksta iegūšana no pelēktoņu attēla
Teksta iegūšana no pelēktoņu attēla
import pytesseract
import cv2
image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)
print(text)