Open-Source Python Bibliotek for Tekstuttrekk fra Bilder
Bruk PyTesseract OCR for enkelt å trekke ut trykt og håndskrevet tekst fra bilder.
Hva er PyTesseract API for Python?
PyTesseract er en Python-wrapper for Tesseract-OCR, et kraftig open-source verktøy for tekstuttrekk fra bilder. Den lar utviklere enkelt konvertere skannede dokumenter, håndskrevne notater og tekst fra bilder til et maskinlesbart format. PyTesseract brukes ofte i automatisering, datauttrekk, dokumentdigitalisering og AI-applikasjoner som krever optisk tegngjenkjenning (OCR).
Dette biblioteket er spesielt nyttig for automatisering av dataregistrering, tekstgjenkjenning fra skjermbilder og digitalisering av trykte dokumenter. Med støtte for flere språk og avanserte bildebehandlingsteknikker gir PyTesseract en effektiv og fleksibel løsning for tekstuttrekk fra bilder.
Hovedfunksjoner i PyTesseract API
- Konvertering av bilder til tekst: Trekk ut trykt eller håndskrevet tekst fra bilder ved hjelp av OCR.
- Flerspråklig støtte: Gjenkjenner over 100 språk ved hjelp av Tesseract OCR-modeller.
- Kompatibilitet med forhåndsbehandling: Fungerer med OpenCV og PIL for å forbedre bildekvaliteten før OCR-behandling.
- Tekstuttrekk fra PDF: Konverterer skannede PDF-filer til søkbar tekst.
- Tekstuttrekk med avgrensningsbokser: Henter tekst sammen med posisjonen i bildet.
- Batchbehandling: Utfører OCR effektivt på flere bilder samtidig.
- Støtte for flere plattformer: Fungerer på Windows, macOS og Linux.
- Open-source: Gratis å bruke og støttet av fellesskapet.
Installasjon av PyTesseract
Før du bruker PyTesseract, må du sørge for at Tesseract-OCR er installert på systemet ditt.
Installasjonsprosess
Installer PyTesseract og nødvendige avhengigheter
pip install pytesseract pillow opencv-python
Installering av Tesseract-OCR på Windows:
Installering av Tesseract-OCR (Windows)
# Last ned Tesseract fra:
https://github.com/UB-Mannheim/tesseract/wiki
Installering på Linux:
Installering av Tesseract-OCR (Linux)
sudo apt install tesseract-ocr
Kodeeksempler for Tekstuttrekk med PyTesseract API
Eksempel 1: Trekk ut tekst fra et bilde
Trekk ut tekst fra et bilde
import pytesseract
from PIL import Image
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
image = Image.open("sample.png")
text = pytesseract.image_to_string(image)
print(text)
Eksempel 2: Tekstuttrekk med avgrensningsbokser
Tekstuttrekk med avgrensningsbokser
import pytesseract
import cv2
image = cv2.imread("sample.png")
h, w, _ = image.shape
boxes = pytesseract.image_to_boxes(image)
for b in boxes.splitlines():
b = b.split()
x, y, x2, y2 = int(b[1]), int(b[2]), int(b[3]), int(b[4])
cv2.rectangle(image, (x, h - y), (x2, h - y2), (0, 255, 0), 2)
cv2.imwrite("output.png", image)
Eksempel 3: Trekk ut tekst fra et gråskalabilde
Trekk ut tekst fra et gråskalabilde
import pytesseract
import cv2
image = cv2.imread("sample.png")
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
text = pytesseract.image_to_string(gray)
print(text)