Beth Yw Algorithm OCR a Pam Mae'n Ddefnyddiol?

Oct 20, 2022Gadewch neges

Cludadwy 3.46 modfedd Cyfieithydd 112 Cofnod Ieithoedd Llais 99 y cant Sgan Cywir Iaith Cyfieithu Darllenydd Pen Cyfieithydd Clyfar

Detail-01

Gan ddefnyddio'r dechnoleg ddiweddaraf:

1. Mabwysiadu'r diweddarafOCRtechnoleg adnabod testun;

2. hunan-ddatblygedigcydnabyddiaeth graffegtechnoleg algorithm;

3. Mabwysiadu diweddaraf TsieinaTTStechnoleg adnabod lleferydd.

Defnyddio'r sglodyn craidd ARM Cortex-A-A{{2}GHz diweddaraf, gyda TTS pwerus a thechnoleg cyfieithu sain, i sicrhau cyfieithu cywir, ynganiad cywir, gallu sganio cyflym, a'r cyflymder sydd ei angen yn unig 0.5s


Beth yw algorithm adnabod nodau optegol a pham ei fod yn ddefnyddiol?


OCR

Cydnabod Cymeriad Optegol (OCR)yn fath o anodiad sy'n caniatáu i ddelweddau o wybodaeth wedi'i theipio neu mewn llawysgrifen gael eu trawsgrifio i destun y gall peiriant ei ddarllen.


Er bod OCR yn aml yn cael ei anwybyddu, mae'n gynorthwyydd unigryw pan fyddwn yn siarad am awtomeiddio. Mae'n dileu'r llif o ddogfennau papur diangen. Mae'n caniatáu ichi ddosbarthu, trefnu, storio, rheoli a rhannu gwybodaeth tra'n osgoi'r risgiau diogelwch sy'n gysylltiedig â natur ffisegol dogfennau papur.


Mae argaeledd OCR wedi dod yn ehangach. Mae'n rhaid eich bod wedi ei weld mewn sganwyr tocynnau ffilm neu feysydd awyr a gorsafoedd trên. Fe'i defnyddir ar gyfer echdynnu data a monitro diogelwch (meddyliwch am blatiau trwydded car neu arwyddion stryd). Mae llofnodion electronig yn ffurf arall ar OCR. Ond gellir dadlau mai'r defnydd mwyaf cyffredin o OCR yw trosi delweddau o ddogfennau busnes yn destun digidol y gellir ei chwilio, ei olygu a'i reoli.


Gadewch i ni ddychmygu sefyllfa. Rydych chi'n mynychu cyfarfod pwysig. Mae eich partner busnes yn dangos dogfen i chi; rydych chi'n tynnu'ch ffôn clyfar allan ac yn tynnu llun cyflym. Mae'n ymddangos bod gennych chi'r wybodaeth sydd ei hangen arnoch chi, ond mae ar ffurf delwedd. Ni allwch ddefnyddio'r ddogfen hon yn uniongyrchol. Yn lle hynny, mae angen i chi drosi picsel y llun i fformat darllenadwy fel y gallwch olygu a thrin y wybodaeth sydd ynddo.


At hynny, nid yw awtomeiddio ar sail OCR yn ymwneud â rhannu gwybodaeth ar ffurf ddigidol yn unig. Pan fydd gennych lawer o ddogfennau, gall peiriannau eu defnyddio fel cofnodion data i ddod o hyd i batrymau a thueddiadau. Mae delweddu hefyd wedi dod yn haws: os oes angen diagramau, cynlluniau, neu daenlenni arnoch, mae defnyddio dogfennau digidol yn llawer cyflymach nag ysgrifennu adroddiad sy'n ddymunol yn weledol â llaw. Mae OCR yn caniatáu ichi dreulio llai o amser yn prosesu pob dogfen newydd, gan arbed costau llafur a chanolbwyntio ar strategaethau gwerth ychwanegol.

text-attributes-for-an-ocr

Sut mae'r algorithm OCR yn gweithio?

Mae pobl yn dda iawn am adnabod cymeriadau testun, hyd yn oed os ydyn nhw mewn llawysgrifen. Ar gyfer peiriant, fodd bynnag, mae hwn yn orchymyn uchel. Mae angen algorithmau dysgu peirianyddol arnyn nhw i ddysgu sut i ddarllen sut mae pobl yn darllen. I'r perwyl hwn, mae angen hyfforddiant helaeth ar algorithmau OCR i brosesu delweddau testun.


Er mwyn deall sut mae'r algorithm OCR yn gweithio, yn gyntaf rydym am ddweud mwy wrthych am destun a'i briodweddau. Pam? Oherwydd dyna sut mae peiriannau'n gweld testun: fel rhan o ddelwedd.


Priodweddau Testun Algorithmau OCR

Mae gwahaniaeth mawr rhwng y testun y gallwch chi ddod o hyd iddo mewn lleoliad masnachol a'r testun sy'n bodoli "yn y gwyllt": ar ffurf stryd, nodiadau mewn llawysgrifen, captcha, ac ati Un yn yr adroddiad chwarterol sgan heb ei strwythuro'n dda filltiroedd i ffwrdd o graffiti ar hap sy'n cael ei ddal ar gamera gan dronau gwyliadwriaeth. Fodd bynnag, mae'r ddwy enghraifft hyn yn dangos llawer o briodweddau sy'n helpu i esbonio delweddau testun i algorithmau dysgu peirianyddol.


  • Dwysedd.Mewn sganiau dogfennau, mae testun yn aml yn ddwysach na thestun ar luniau cornel stryd.

  • Strwythur.Y gwahaniaeth yw'r gwahaniaeth rhwng llinellau trefnedig o destun printiedig a strwythur gwael (neu ddiffyg strwythur) mewn rhestr siopa mewn llawysgrifen.

  • Ffont a maint.Mae ffontiau a llythrennau anhyblyg o'r un maint yn fwy adnabyddus nag arwyddion stryd gydag arddull llawysgrifen anghyson neu rydd-lawr.

  • Math o gymeriad.Mae'r eiddo hwn yn nodi nid yn unig presenoldeb llythrennau, ond hefyd presenoldeb rhifau, symbolau, a chymeriadau arbennig. Hefyd, mae iaith yn bwysig. Mae dogfen fel arfer yn cynnwys un iaith; ar y llaw arall, gall arwydd neu graffiti gynnwys gwybodaeth mewn sawl iaith.

  • Swn.Mae'n bwysig rhoi sylw i sut y ceir y ddelwedd (dogfennau wedi'u sganio neu eu llungopïo; arwyddion y tynnwyd llun ohonynt a phlatiau trwydded). Yn dibynnu ar y dull, mae lluniau'n tueddu i gynhyrchu mwy o sŵn na sganiau.

Lleoliad ac aliniad y testun ar y ddelwedd. Mae'r sgan fel arfer yn y blaen ac yn y canol heb fawr o ogwydd. Ar y llaw arall, nid yw lluniau'n cynnig unrhyw gynllun llym: gall testun fod mewn unrhyw ran o'r ddelwedd, a gellir ei dynnu o'r ochr.

Fel y gwelwch, nid dim ond ychydig linellau o gymeriadau yw testun. Yn naturiol, mae priodoleddau testun yn helpu i adeiladu arlliwiau algorithmau OCR.


Nawr ein bod ni'n gwybod sut mae testun yn wahanol, gadewch i ni weld sut i adeiladu algorithm OCR.


Y broses o adeiladu, labelu a hyfforddi algorithmau adnabod testun

scheme-ocr


Adeiladu, Labelu a Hyfforddi Algorithmau Cydnabod Testun Adeiladu, Labelu, a Hyfforddi Algorithmau Cydnabod Testun

Mae adeiladu algorithm OCR o'r dechrau yn cymryd llawer o gamau.


Awgrym: Dyma drosolwg byr o'r prif gamau sydd eu hangen i adeiladu injan OCR. Os ydych chi eisiau dadansoddiad manylach, dilynwch y ddolen hon i ddarllen erthygl hir ar gylch bywyd prosiect AI.


— Cam 1. Casgliad

Y peth cyntaf sydd angen i chi ei wneud yw casglu cronfa ddata o ddogfennau. Gallwch eisoes gael dogfennau papur yr ydych am eu digideiddio. Fodd bynnag, er mwyn adeiladu algorithm adnabod cymeriad optegol, mae angen i chi ddewis sampl gynrychioliadol ddigon mawr. Mae hyn yn golygu y dylai'r set o ddogfennau a ddewiswch fod yn berthnasol i'ch nod terfynol.


Yn ogystal, mae'r cam hwn yn cynnwys sganio, copïo neu dynnu lluniau o ddogfennau. Os yw'r delweddau o ansawdd uchel, bydd o fudd mawr ac yn hwyluso'r broses hyfforddi. Darllenwch fwy am nodweddion da set ddata yn ein herthygl.


— Cam 2. Rhagbrosesu

Cyn dechrau adnabod testun, rhaid paratoi, glanhau a optimeiddio delweddau dogfen ar gyfer algorithmau OCR. Mae yna lawer o broblemau a all achosi ansawdd delwedd gwael: golau annigonol, fflachio papur ac adlewyrchiadau, ansawdd camera neu sganiwr gwael, onglau sgiw, nodau coll neu ansawdd print gwael, ac ati.


Os ydych chi am hyfforddi'r algorithm OCR yn iawn, dylech ystyried gwneud y canlynol cyn y cam nesaf:

Trosi'r ddelwedd i ddu a gwyn. Gall dileu lliwiau leihau amwysedd wrth ganfod testun.

Sythu ac alinio. Mae onglau od yn cymhlethu'r broses ganfod yn sylweddol.

Torri a chanoli testun. Gadewch y rhannau pwysig yn unig: dylai'r testun fod yn flaen ac yn y canol, heb ei guddio yn rhywle yn y corneli.

Defnyddiwch hidlwyr i leihau sŵn. Dylai cymeriadau unigol sefyll allan o'r cefndir. Cofiwch fod sganiau fel arfer yn fwy craff na lluniau.


— Cam 3. Labelu Data

Mae hwn yn gam hollbwysig yn yr algorithm OCR, a dyna lle rydyn ni yma i'ch helpu chi. Mae'r broses adnabod testun yn cynnwys dwy dasg: canfod testun a chydnabod.


Rydym yn defnyddio bocsio i amlygu ac amlinellu'r maes testun. Mae hyn yn dweud wrth yr algorithm OCR beth i edrych amdano yn y ddelwedd.

Yna mae ein hanodyddion yn trawsgrifio (mewnbynnu testun â llaw) ar y delweddau. Yn ddiweddarach, bydd algorithmau OCR yn gallu defnyddio dosbarthiad delwedd i ddod o hyd i batrymau rhwng setiau picsel a mathau o nodau.

Yn ogystal, fe wnaethom hefyd gynnal sawl rownd o SA. Mae pobl yn llawer gwell am adnabod testun mewn delweddau na pheiriannau, ond hyd yn oed wedyn rydym am sicrhau nad oes dim yn cael ei golli.


Mae'r cam hwn o labelu data yn cymryd llawer o amser ac ymdrech, ond nid oes rhaid i chi boeni amdano. Byddem wrth ein bodd yn cymryd y dasg hon oddi ar eich ysgwyddau. Mae anodi data ar gyfer tasgau OCR yn un o nodweddion Label Your Data. Rydyn ni wedi'i wneud o'r blaen a byddem wrth ein bodd yn ei wneud eto ar gyfer eich prosiect OCR. Ffoniwch ni heddiw i ddysgu mwy!


— Cam 4. hyfforddiant

Nawr eich bod wedi anodi dogfennau, gallwch ddechrau hyfforddi'r algorithm OCR. Mae'r cam hwn yn dibynnu ar y math o strategaeth a ddefnyddiwch i adeiladu'ch algorithm OCR. Mae'r strategaethau hyn yn amrywio'n fawr, o dechnegau gweledigaeth gyfrifiadurol clasurol i ddulliau dysgu dwfn arbenigol yn seiliedig ar adeiladu rhwydweithiau niwral.


Mae gan bob strategaeth ei fanteision. Ond ni waeth pa ddull a ddewiswch, nid yw hyfforddiant algorithm ML fel arfer yn gweithio ar y cynnig cyntaf. Mae ailhyfforddi a gwella yn arferion cyffredin. Peidiwch â digalonni os nad yw'r algorithm OCR yn darparu adnabyddiaeth testun hollol gywir ar unwaith. Gydag ymarfer a dyfalbarhad, fe gyrhaeddwch chi!


— Cam 5. Ôl-brosesu a sicrhau ansawdd

Yn wir, os nad ydych am wneud popeth eto, mae angen i chi sicrhau ansawdd bob cam o'r ffordd. Ond dyma'r cam SA olaf a gwneud i'ch algorithm OCR weithio. Mae'n bryd medi ffrwyth eich gwaith caled ac yn olaf digideiddio llif gwaith eich dogfen, gan arbed amser ac arian i'ch busnes.


image

Er na chaiff ei drafod yn aml y tu allan i'r diwydiant dysgu peiriannau, mae gan adnabod cymeriad optegol un o'r graddfeydd defnyddioldeb uchaf mewn AI. Mae busnesau yn dal i weithredu yn seiliedig ar lawer iawn o ddogfennau papur, arfer hen ffasiwn a bron yn niweidiol. Gall OCR helpu busnesau i ddelio ag ef trwy ddigideiddio'r llif gwaith.


Yn ogystal, nid yw cwmpas cymhwyso OCR yn dod i ben yno. Gall unrhyw destun, boed yn adroddiad wedi'i drefnu'n daclus, yn arwydd siop ar hap, neu'n nodyn mewn llawysgrifen, gael ei brosesu gan OCR a'i drosi'n destun y gall peiriant ei ddarllen. Mae hwn yn gam tuag at awtomeiddio data mawr.


Yn rhyfedd iawn, er nad yw adeiladu algorithmau adnabod testun yn dechnoleg newydd, mae mor heriol ag erioed. Wrth gwrs, mae algorithmau OCR ffynhonnell agored ar gael i'r cyhoedd. Fodd bynnag, os ydych chi eisiau model adnabod testun o'r radd flaenaf ar gyfer eich pwrpas penodol, mae'n well adeiladu un eich hun. Gallwn ni eich helpu chi! Dywedwch wrthym am eich prosiect a byddwn yn anodi'r dogfennau'n broffesiynol i hyfforddi'ch algorithm OCR.