Réiteach OCR bunaithe ar fhoghlaim dhomhain i Python
Bain úsáid as docTR chun téacs a bhaint agus a aithint go cruinn ó íomhánna.
Cad é API docTR do Python?
Is leabharlann OCR foinse oscailte bunaithe ar fhoghlaim dhomhain i Python é docTR (Document Text Recognition). Soláthraíonn sé braite agus aithint téacs den scoth le haghaidh doiciméid scanta, íomhánna agus comhaid PDF. Trí úsáid a bhaint as ailtireachtaí nua-aimseartha foghlama domhain, cinntíonn docTR cruinneas ard agus éifeachtacht is fearr agus struchtúr na ndoiciméad á chaomhnú aige.
Úsáidtear docTR go forleathan chun doiciméid a dhigitiú, sonraí a bhaint go huathoibríoch, agus feidhmchláir aithint téacs bunaithe ar AI. Tacaíonn sé le teangacha iolracha, aithint lámhscríbhneoireachta, agus luasghéarú GPU le haghaidh feidhmíochta feabhsaithe.
Gnéithe Príomhúla API docTR
- OCR ardleibhéil bunaithe ar fhoghlaim dhomhain: Úsáideann sé líonraí néarógacha chun braite agus aithint téacs a dhéanamh go cruinn.
- Tacaíocht ilfhormáid: Oibríonn sé le híomhánna, comhaid PDF agus doiciméid scanta.
- Aithint lámhscríbhneoireachta: Braith agus bain téacs lámhscríofa le cruinneas ard.
- Aithint ilteangach: Tacaíonn sé le teangacha agus aibítrí éagsúla.
- Optamaithe le haghaidh luas: Baintear téacs go héifeachtach le luasghéarú GPU.
- Caomhnaíonn sé an leagan amach: Coinníonn sé struchtúr na ndoiciméad agus an téacs á aithint.
- Inscálaithe agus foinse oscailte: Saor in aisce agus cothabhálaítear é go gníomhach le haghaidh feabhsuithe leanúnacha.
Tús a chur le API docTR
Chun docTR a shuiteáil, bain úsáid as an ordú pip seo:
Suiteáil docTR
pip install python-doctr
Chun luasghéarú GPU a ghníomhachtú le haghaidh próiseála níos tapúla, suiteáil na spleáchais bhreise:
Suiteáil spleáchais GPU
pip install tensorflow-gpu torch torchvision
Samplaí Cód le haghaidh Baint Téacs le docTR
Seo roinnt samplaí a thaispeánann conas téacs a bhaint as íomhánna agus doiciméid ag baint úsáide as docTR.
Sampla 1: Téacs a Bhaint as Íomhá
Téacs a bhaint as íomhá
from doctr.io import DocumentFile
from doctr.models import ocr_predictor
doc = DocumentFile.from_images("sample.png")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
Sampla 2: Próiseáil Doiciméid PDF Illeathanach
Téacs a bhaint as PDF
from doctr.io import DocumentFile
from doctr.models import ocr_predictor
doc = DocumentFile.from_pdf("sample.pdf")
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
Sampla 3: Aithint Téacs Lámhscríofa
Téacs lámhscríofa a bhaint
from doctr.models import ocr_predictor
from doctr.datasets import synthetic_documents
doc = synthetic_documents()[0]
model = ocr_predictor(pretrained=True)
result = model(doc)
print(result.export())
Conclúid
Is réiteach OCR cumhachtach é API docTR atá bunaithe ar fhoghlaim dhomhain, rud a éascaíonn baint téacs as íomhánna, comhaid PDF, agus doiciméid lámhscríofa. Cinntíonn sé cruinneas ard agus caomhnaíonn sé struchtúr na ndoiciméad, rud a fhágann go bhfuil sé ina uirlis luachmhar le haghaidh próiseáil doiciméad AI-bhunaithe, uathoibriú agus eastóscadh sonraí.
Cibé an bhfuil tú ag obair ar dhigitiú doiciméad, iontráil sonraí uathoibrithe, nó aithint téacs AI-bhunaithe, cuireann docTR réiteach solúbtha agus éifeachtach ar fáil atá oiriúnach do do riachtanais.