Řešení OCR založené na hlubokém učení v Pythonu
Využijte docTR pro přesnou extrakci a rozpoznání textu z obrázků.
Co je docTR API pro Python?
docTR (Document Text Recognition) je open-source knihovna OCR založená na hlubokém učení v Pythonu. Poskytuje špičkovou detekci a rozpoznávání textu pro naskenované dokumenty, obrázky a PDF. Díky moderním architekturám hlubokého učení zajišťuje docTR vysokou přesnost a efektivitu při extrakci textu, přičemž zachovává strukturu dokumentu.
docTR se široce využívá pro digitalizaci dokumentů, automatizovanou extrakci dat a aplikace AI pro rozpoznávání textu. Podporuje více jazyků, rozpoznávání rukopisu a akceleraci pomocí GPU pro vyšší výkon.
Klíčové vlastnosti docTR API
- Pokročilé OCR založené na hlubokém učení: Používá neuronové sítě pro přesnou detekci a rozpoznávání textu.
- Podpora více formátů: Funguje bez problémů s obrázky, PDF a naskenovanými dokumenty.
- Rozpoznávání rukopisu: Detekuje a extrahuje ručně psaný text s pozoruhodnou přesností.
- Podpora více jazyků: Rozpoznává text v různých jazycích a písmech.
- Optimalizováno pro rychlost: Efektivní extrakce textu s akcelerací pomocí GPU.
- Zachování rozložení dokumentu: Při rozpoznávání textu zachovává strukturu dokumentu.
- Škálovatelné a open source: Zdarma k použití a aktivně udržované pro neustálé zlepšování.
Začínáme s docTR API
Pro instalaci docTR použijte následující příkaz pip:
Instalace docTR
pip install python-doctr
Pokud chcete povolit akceleraci pomocí GPU pro rychlejší zpracování, nainstalujte další závislosti:
Instalace závislostí pro GPU
pip install tensorflow-gpu torch torchvision
Ukázky kódu pro extrakci textu pomocí docTR API
Níže jsou uvedeny příklady demonstrující extrakci textu z obrázků a dokumentů pomocí docTR.
Příklad 1: Extrakce textu z obrázku
Extrakce textu z obrázku
from doctr.io import DocumentFile
from doctr.models import ocr_predictor
doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
Příklad 2: Zpracování více stránkového PDF
Extrakce textu z PDF
from doctr.io import DocumentFile
from doctr.models import ocr_predictor
doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
Příklad 3: Rozpoznání ručně psaného textu
Extrakce ručně psaného textu
from doctr.models import ocr_predictor
from doctr.datasets import synthetic_documents
doc = synthetic_documents()[0]
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
Závěr
docTR API je výkonné OCR řešení založené na hlubokém učení, které zjednodušuje extrakci textu z obrázků, PDF a ručně psaných dokumentů. Zajišťuje vysokou přesnost při zachování struktury dokumentu, což z něj činí cenný nástroj pro AI-driven zpracování dokumentů, automatizaci a extrakci dat.
Ať už pracujete na digitalizaci dokumentů, automatizovaném zadávání dat nebo AI-based rozpoznávání textu, docTR poskytuje flexibilní a efektivní řešení přizpůsobené vašim potřebám.