PaddleOCR: OCR Tionsclaíoch le haghaidh Aisghabháil Téacs Ilteangach

Bainigh amach agus aithin téacs ó íomhánna agus doiciméid le cruinneas agus luas ard.

Cad é API PaddleOCR?

Is uirlis chumhachtach éasca le húsáid é API Python PaddleOCR le haghaidh tascanna aitheantais optúil carachtar (OCR), deartha chun cabhrú le forbróirí téacs a bhaint amach agus a anailísiú ó íomhánna le cruinneas ard. Tógtha ar chreat foghlama domhain PaddlePaddle, tacaíonn PaddleOCR le raon leathan teangacha agus tá samhlacha réamh-oilte aige le haghaidh braite téacs, aitheantais agus anailíse leagan amach. Leis an gcomhéadan Python iomasach, is féidir le húsáideoirí gnéithe OCR a chomhtháthú go tapa ina n-iarratais, cibé acu le haghaidh digitiú doiciméad, aisghabháil téacs ó ghrianghraif nó próiseáil uathoibrithe sonraí. Tá API Python PaddleOCR idéalach d'aon duine atá ag iarraidh réitigh OCR láidre a chur i bhfeidhm le suíomh íosta agus solúbthacht uasta.

Buntáistí PaddleOCR:

Tacaíocht ilteangach: Samhlacha réamh-oilte do 100+ teanga (Sínis, Béarla, Araibis srl. san áireamh)
Ardchruinneas: Baineann samhlacha sraith PP-OCR marcanna ceannródaíocha amach ar thacair shonraí ICDAR
Píblíne iomlán: Ó bhrath téacs go dtí aitheantas agus anailís leagan amach
Samhlacha éadroma: Optamaithe le haghaidh gléasanna soghluaiste agus imeall (m.sh. PP-OCRv3)

Ó dhoiciméid scanáilte go comharthaí sráide, baineann PaddleOCR téacs amach le cruinnes ceannródaíoch sa tionscal.

GitHub Stats

Name:
Language:
Stars:
Forks:
License:
Repository was last updated at

Cén fáth PaddleOCR a roghnú?

Sárchaighdeán foinse oscailte: Níos mó ná 30,000 réalta GitHub agus ranníocaíochtaí gníomhacha ón bpobal
Imscaradh solúbtha: Tacaíonn le Python, C++ agus ardáin shoghluaiste (Android/iOS)
Anailís leagan amach: Aithníonn réigiúin téacs, táblaí agus figiúirí i ndoiciméid chasta
Nuashonruithe leanúnacha: Eisiúintí rialta samhlacha (m.sh. PP-OCRv4)
Oiriúnach don ghnó: Ceadúnas Apache 2.0 le haghaidh úsáide fiontraíochta

Suiteáil

Teastaíonn Python 3.7+ ó PaddleOCR agus is féidir é a shuiteáil trí pip. Teastaíonn CUDA/cuDNN le haghaidh tacaíochta GPU.

Suiteáil Bhunúsach


pip install paddleocr paddlepaddle  #Leagan LAP

Le haghaidh luathú GPU:

Tacaíocht GPU


pip install paddleocr paddlepaddle-gpu  #Teastaíonn CUDA 10.2+

Nóta: Íoslódálfar samhlacha réamh-oilte go huathoibríoch ar an gcéad úsáid nó de láimh trí paddleocr --lang en.

Samplaí Cód

Déan iniúchadh ar chumais PaddleOCR leis na samplaí seo. Glactar leis go bhfuil an samhal Béarla suiteáilte agat.

PaddleOCR Python

Sampla 1: OCR Bunúsach

Chun téacs a bhaint as íomhá ag baint úsáide as PaddleOCR leis na samhlacha réamhshocraithe, níl de dhíth ort ach an t-inneall OCR a thúsú leis an gcumraíodh caighdeánach, a chuimsíonn tacaíocht don Bhéarla agus aicmiú uillinn chun cruinneas a fheabhsú. Úsáideann PaddleOCR samhlacha réamh-oilte braite, aitheantais agus aicmithe chun téacs san íomhá ionchuir a aithint agus a léirmhíniú. Nuair a bheidh an íomhá próiseáilte, cuirfidh an t-inneall OCR an téacs braite ar ais in éineacht lena shuíomh agus scór muiníne do gach toradh. Soláthraíonn an suíomh seo bealach tapa éifeachtach chun ábhar téacsúil a bhaint as íomhánna gan a bheith ag teastáil oiliúint saincheaptha samhail nó cumraíocht chasta.

OCR Íomhá


from paddleocr import PaddleOCR

ocr = PaddleOCR(use_angle_cls=True, lang='en')  #Túsú
result = ocr.ocr('image.jpg', cls=True)  #Próiseáil íomhá

# Téacs aitheanta a phriontáil
for line in result:
    print(line[-1][0])  #Ábhar téacs

Áirítear ar an aschur:

Ábhar téacs agus scóir muiníne
Comhordanáidí bosca teorann

Sampla 2: Próiseáil Baisc

Chun il-íomhánna a phróiseáil go héifeachtach le PaddleOCR, is féidir leat úsáid a bhaint as teicnící próiseála baisc a íoslaghdaíonn túsuithe iomarcacha agus a optamaíonn feidhmíocht. In ionad an t-inneall OCR a thúsú do gach íomhá, moltar aon chás amháin den tsamhail OCR a chruthú agus é a athúsáid do gach íomhá ionchuir. Laghdaíonn an cur chuige seo am próiseála agus tomhaltas acmhainne go mór. Trí liosta de chosáin íomhá a sheoladh chuig an inneall OCR i lúb nó trí úsáid a bhaint as próiseáil chomhthreomhar (nuair is cuí), is féidir leat téacs a bhaint go tapa agus go héifeachtach as tacair mhóra íomhánna, rud a fhágann go bhfuil sé idéalach le haghaidh sreabhadh oibre ina mbíonn baisc doiciméad, cartlanna scanáilte nó anailís ollmhór íomhá.

OCR Baisc


image_paths = ['doc1.jpg', 'doc2.png']
results = ocr.ocr(image_paths, batch_size=4)  #Próiseáil chomhthreomhar

Sampla 3: Anailís Leagan Amach

Is féidir PaddleOCR a úsáid chun téacs a aithint ach freisin chun réigiúin shonracha téacs a aithint agus gnéithe struchtúrtha cosúil le táblaí in íomhá a bhrath. Lonnaíonn an córas réigiúin téacs ar dtús trína mhúnla braite, a imlíníonn gach réigiún téacs le boscaí teorann, rud a ligeann d'úsáideoirí tuiscint a fháil ar áit a bhfuil an téacs sa íomhá. Le haghaidh leaganacha amach níos casta, cosúil le foirmí nó doiciméid ina bhfuil táblaí, tacaíonn PaddleOCR le hanailís leagan amach agus aitheantas struchtúr táblaí. Ligeann sé seo sraitheanna, colúin agus teorainneacha cille a bhrath, rud a fhágann go bhfuil sé indéanta sonraí táblaí a bhaint i bhformáid eagraithe. Tá cumais den sórt sin an-úsáideach chun doiciméid scanáilte, sonraíscéalta nó scarbhileoga a dhigitiú ina bhfuil téacs saor in aisce agus sonraí táblaí le chéile.

Braite Leagan Amach


from paddleocr import PPStructure

structure_engine = PPStructure(table=False, ocr=False)
layout_result = structure_engine('document.pdf')

Gnéithe Casta

Tacaíonn PaddleOCR le sreabhanna oibre casta:

Oiliúint saincheaptha: Déan samhlacha a mhínghéilliú ar do shonraí:
Oiliúint Samhail
```
    python tools/train.py -c configs/det/det_mv3_db.yml
    
```
Measctha ilteangach: Próiseáil doiciméid ilteangacha:
OCR Ilteangach
```
    ocr = PaddleOCR(lang='chinese+english')
    
```

Tacaíocht PDF: Aisghabháil téacs díreach ó PDF:

Próiseáil PDF


    result = ocr.ocr('document.pdf', type='pdf')

Conclúid

Soláthraíonn PaddleOCR réitigh OCR atá réidh le haghaidh táirgeachta le tacaíocht ilteangach gan sárú agus scálaitheacht. Ideálach le haghaidh:

Digitíú doiciméad: PDFanna scanáilte, sonraíscéalta, admháil
Feidhmchláir ilteangacha: Aitheantas pas, leabhair ilteangacha
Imscaradh imeall: Aipeanna soghluaiste le OCR ar an gléas

Le tacaíocht ó éiceachóras foghlama domhain PaddlePaddle, leanann PaddleOCR ag leagadh caighdeáin i gcruinneas agus éifeachtúlacht OCR.