Open-Source Python Bibliotek for Tekstuttrekk fra Bilder

Bruk PyTesseract OCR for enkelt å trekke ut trykt og håndskrevet tekst fra bilder.

Hva er PyTesseract API for Python?

PyTesseract er en Python-wrapper for Tesseract-OCR, et kraftig open-source verktøy for tekstuttrekk fra bilder. Den lar utviklere enkelt konvertere skannede dokumenter, håndskrevne notater og tekst fra bilder til et maskinlesbart format. PyTesseract brukes ofte i automatisering, datauttrekk, dokumentdigitalisering og AI-applikasjoner som krever optisk tegngjenkjenning (OCR).

Dette biblioteket er spesielt nyttig for automatisering av dataregistrering, tekstgjenkjenning fra skjermbilder og digitalisering av trykte dokumenter. Med støtte for flere språk og avanserte bildebehandlingsteknikker gir PyTesseract en effektiv og fleksibel løsning for tekstuttrekk fra bilder.

Hovedfunksjoner i PyTesseract API

Konvertering av bilder til tekst: Trekk ut trykt eller håndskrevet tekst fra bilder ved hjelp av OCR.
Flerspråklig støtte: Gjenkjenner over 100 språk ved hjelp av Tesseract OCR-modeller.
Kompatibilitet med forhåndsbehandling: Fungerer med OpenCV og PIL for å forbedre bildekvaliteten før OCR-behandling.
Tekstuttrekk fra PDF: Konverterer skannede PDF-filer til søkbar tekst.
Tekstuttrekk med avgrensningsbokser: Henter tekst sammen med posisjonen i bildet.
Batchbehandling: Utfører OCR effektivt på flere bilder samtidig.
Støtte for flere plattformer: Fungerer på Windows, macOS og Linux.
Open-source: Gratis å bruke og støttet av fellesskapet.

Installasjon av PyTesseract

Før du bruker PyTesseract, må du sørge for at Tesseract-OCR er installert på systemet ditt.

Installasjonsprosess

Installer PyTesseract og nødvendige avhengigheter


pip install pytesseract pillow opencv-python

Installering av Tesseract-OCR på Windows:

Installering av Tesseract-OCR (Windows)


# Last ned Tesseract fra:
https://github.com/UB-Mannheim/tesseract/wiki

Installering på Linux:

Installering av Tesseract-OCR (Linux)


sudo apt install tesseract-ocr

Kodeeksempler for Tekstuttrekk med PyTesseract API

Eksempel 1: Trekk ut tekst fra et bilde

Trekk ut tekst fra et bilde


import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

image = Image.open("sample.png")
text = pytesseract.image_to_string(image)

print(text)

Eksempel 2: Tekstuttrekk med avgrensningsbokser

Tekstuttrekk med avgrensningsbokser


import pytesseract
import cv2

image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)

for b in boxes.splitlines():
    b = b.split()
    x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
    cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)

cv2.imwrite("output.png", image)

Eksempel 3: Trekk ut tekst fra et gråskalabilde

Trekk ut tekst fra et gråskalabilde


import pytesseract
import cv2

image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)

print(text)