Gall iaith Vokenization weld

CREDYD DELWEDD:

iStock

Vokenization: Iaith y gall AI weld

Gyda delweddau bellach yn cael eu hymgorffori mewn hyfforddiant systemau deallusrwydd artiffisial (AI), efallai y bydd robotiaid yn gallu “gweld” gorchmynion yn fuan.

Awdur:
enw awdur
Rhagolwg Quantumrun
Efallai y 9, 2023

Mae prosesu iaith naturiol (NLP) wedi galluogi systemau deallusrwydd artiffisial (AI) i ddysgu lleferydd dynol trwy ddeall geiriau a chyfateb cyd-destun â'r teimlad. Yr unig anfantais yw bod y systemau NLP hyn yn seiliedig ar destun yn unig. Mae Vokenization ar fin newid hynny i gyd.

Cyd-destun Vokenization

Defnyddir dwy raglen dysgu peiriant seiliedig ar destun (ML) yn aml i hyfforddi AI i brosesu a deall iaith ddynol: Trawsnewidydd Cyn-hyfforddedig Generative OpenAI 3 (GPT-3) a BERT (Birectional Encoder Representations from Transformers) Google. Mewn terminoleg AI, mae'r geiriau a ddefnyddir mewn hyfforddiant NLP yn cael eu galw'n docynnau. Sylwodd ymchwilwyr o Brifysgol Gogledd Carolina (UNC) fod rhaglenni hyfforddi testun yn gyfyngedig oherwydd na allant "weld," sy'n golygu na allant ddal gwybodaeth weledol a chyfathrebu.

Er enghraifft, os bydd rhywun yn gofyn i GPT-3 beth yw lliw'r ddafad, bydd y system yn aml yn ateb "du" hyd yn oed os yw'n amlwg yn wyn. Mae'r ymateb hwn oherwydd y bydd y system sy'n seiliedig ar destun yn ei gysylltu â'r term "dafad ddu" yn lle nodi'r lliw cywir. Trwy ymgorffori delweddau â thocynnau (llais), gall systemau AI feddu ar ddealltwriaeth gyfannol o dermau. Mae Vokenization yn integreiddio vokens i systemau NLP hunan-oruchwyliol, gan ganiatáu iddynt ddatblygu "synnwyr cyffredin."

Nid yw integreiddio modelau iaith a gweledigaeth gyfrifiadurol yn gysyniad newydd, ac mae'n faes sy'n ehangu'n gyflym mewn ymchwil AI. Mae'r cyfuniad o'r ddau fath hyn o AI yn trosoli eu cryfderau unigol. Mae modelau iaith fel GPT-3 yn cael eu hyfforddi trwy ddysgu heb oruchwyliaeth, sy'n caniatáu iddynt raddfa'n hawdd. Mewn cyferbyniad, gall modelau delwedd fel systemau adnabod gwrthrychau ddysgu'n uniongyrchol o realiti ac nid ydynt yn dibynnu ar y tynnu a ddarperir gan y testun. Er enghraifft, gall modelau delwedd gydnabod bod dafad yn wyn trwy edrych ar lun.

Effaith aflonyddgar

Mae'r broses o vokenization yn eithaf syml. Mae Vokens yn cael eu creu trwy aseinio delweddau cyfatebol neu berthnasol i docynnau iaith. Yna, mae algorithmau (vokenizer) wedi'u cynllunio i gynhyrchu llais trwy ddysgu heb oruchwyliaeth (dim paramedrau / rheolau penodol). Gall AI synnwyr cyffredin a hyfforddwyd trwy vokenization gyfathrebu a datrys problemau yn well oherwydd bod ganddynt ddealltwriaeth ddyfnach o'r cyd-destun. Mae'r dull hwn yn unigryw oherwydd ei fod nid yn unig yn rhagweld tocynnau iaith ond hefyd yn rhagweld tocynnau delwedd, sy'n rhywbeth na all modelau BERT traddodiadol ei wneud.

Er enghraifft, bydd cynorthwywyr robotig yn gallu adnabod delweddau a llywio prosesau yn well oherwydd gallant “weld” yr hyn sy'n ofynnol ganddynt. Bydd systemau deallusrwydd artiffisial sydd wedi'u hyfforddi i ysgrifennu cynnwys yn gallu creu erthyglau sy'n swnio'n fwy dynol, gyda syniadau sy'n llifo'n well, yn lle brawddegau digyswllt. O ystyried cyrhaeddiad eang cymwysiadau NLP, gall vokenization arwain at chatbots sy'n perfformio'n well, cynorthwywyr rhithwir, diagnosis meddygol ar-lein, cyfieithwyr digidol, a mwy.

Yn ogystal, mae'r cyfuniad o weledigaeth a dysgu iaith yn dod yn fwy poblogaidd mewn cymwysiadau delweddu meddygol, yn benodol ar gyfer diagnosis delwedd feddygol awtomataidd. Er enghraifft, mae rhai ymchwilwyr yn arbrofi gyda'r dull hwn ar ddelweddau radiograff gyda disgrifiadau testun cysylltiedig, lle gall segmentu semantig gymryd llawer o amser. Gallai'r dechneg vokenization wella'r cynrychioliadau hyn a gwella delweddu meddygol awtomataidd trwy ddefnyddio'r wybodaeth testun.

Ceisiadau am vokenization

Gall rhai ceisiadau am vokenization gynnwys:

Chatbots sythweledol sy'n gallu prosesu sgrinluniau, lluniau, a chynnwys gwefan. Efallai y bydd chatbots cymorth cwsmeriaid, yn arbennig, yn gallu argymell cynhyrchion a gwasanaethau yn gywir.
Cyfieithwyr digidol sy'n gallu prosesu delweddau a fideos a darparu cyfieithiad cywir sy'n ystyried cyd-destun diwylliannol a sefyllfaol.
Sganwyr bot cyfryngau cymdeithasol yn gallu cynnal dadansoddiad teimlad mwy cyfannol trwy gyfuno delweddau, capsiynau a sylwadau. Gall y cymhwysiad hwn fod yn ddefnyddiol wrth gymedroli cynnwys sy'n gofyn am ddadansoddi delweddau niweidiol.
Cynyddu cyfleoedd cyflogaeth ar gyfer gweledigaeth gyfrifiadurol a pheirianwyr dysgu peirianyddol NLP a gwyddonwyr data.
Busnesau newydd sy'n adeiladu ar y systemau AI hyn i'w masnacheiddio neu ddarparu atebion wedi'u teilwra i fusnesau.

Cwestiynau i wneud sylwadau arnynt

Ym mha ffordd arall ydych chi'n meddwl y bydd vokenization yn newid sut rydyn ni'n rhyngweithio â robotiaid?
Sut gall vokenization newid y ffordd yr ydym yn cynnal busnes ac yn rhyngweithio â'n teclynnau (ffonau clyfar ac offer clyfar)?

Ychwanegu at y rhestr