Řešení OCR založené na hlubokém učení v Pythonu

Využijte docTR pro přesnou extrakci a rozpoznání textu z obrázků.

Co je docTR API pro Python?

docTR (Document Text Recognition) je open-source knihovna OCR založená na hlubokém učení v Pythonu. Poskytuje špičkovou detekci a rozpoznávání textu pro naskenované dokumenty, obrázky a PDF. Díky moderním architekturám hlubokého učení zajišťuje docTR vysokou přesnost a efektivitu při extrakci textu, přičemž zachovává strukturu dokumentu.

docTR se široce využívá pro digitalizaci dokumentů, automatizovanou extrakci dat a aplikace AI pro rozpoznávání textu. Podporuje více jazyků, rozpoznávání rukopisu a akceleraci pomocí GPU pro vyšší výkon.

Klíčové vlastnosti docTR API

Pokročilé OCR založené na hlubokém učení: Používá neuronové sítě pro přesnou detekci a rozpoznávání textu.
Podpora více formátů: Funguje bez problémů s obrázky, PDF a naskenovanými dokumenty.
Rozpoznávání rukopisu: Detekuje a extrahuje ručně psaný text s pozoruhodnou přesností.
Podpora více jazyků: Rozpoznává text v různých jazycích a písmech.
Optimalizováno pro rychlost: Efektivní extrakce textu s akcelerací pomocí GPU.
Zachování rozložení dokumentu: Při rozpoznávání textu zachovává strukturu dokumentu.
Škálovatelné a open source: Zdarma k použití a aktivně udržované pro neustálé zlepšování.

Začínáme s docTR API

Pro instalaci docTR použijte následující příkaz pip:

Instalace docTR


pip install python-doctr

Pokud chcete povolit akceleraci pomocí GPU pro rychlejší zpracování, nainstalujte další závislosti:

Instalace závislostí pro GPU


pip install tensorflow-gpu torch torchvision

Ukázky kódu pro extrakci textu pomocí docTR API

Níže jsou uvedeny příklady demonstrující extrakci textu z obrázků a dokumentů pomocí docTR.

docTR API pro OCR

Příklad 1: Extrakce textu z obrázku

Extrakce textu z obrázku


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

Příklad 2: Zpracování více stránkového PDF

Extrakce textu z PDF


from doctr.io import DocumentFile
from doctr.models import ocr_predictor

doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

Příklad 3: Rozpoznání ručně psaného textu

Extrakce ručně psaného textu


from doctr.models import ocr_predictor
from doctr.datasets import synthetic_documents

doc = synthetic_documents()[0]
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())

Závěr

docTR API je výkonné OCR řešení založené na hlubokém učení, které zjednodušuje extrakci textu z obrázků, PDF a ručně psaných dokumentů. Zajišťuje vysokou přesnost při zachování struktury dokumentu, což z něj činí cenný nástroj pro AI-driven zpracování dokumentů, automatizaci a extrakci dat.

Ať už pracujete na digitalizaci dokumentů, automatizovaném zadávání dat nebo AI-based rozpoznávání textu, docTR poskytuje flexibilní a efektivní řešení přizpůsobené vašim potřebám.