Vokenizazioa: AIk ikus dezakeen hizkuntza

IRUDIAREN KREDITUA:
Irudiaren kreditu
iStock

Vokenizazioa: AIk ikus dezakeen hizkuntza

Vokenizazioa: AIk ikus dezakeen hizkuntza

Azpitituluaren testua
Irudiak adimen artifizialaren (AI) sistemen prestakuntzan sartzen ari direnez, baliteke robotek laster "ikusi" komandoak gai izatea.
    • Egilea:
    • Egilearen izena
      Quantumrun Prospektiba
    • 9 daiteke, 2023

    Hizkuntza naturalaren prozesamenduak (NLP) adimen artifizialaren (AI) sistemei esker giza hizkera ikastea ahalbidetu du, hitzak ulertuz eta sentimenduarekin testuingurua lotuz. Alde txar bakarra da NLP sistema hauek testuan oinarritutakoak direla. Vokenizazioa hori guztia aldatzear dago.

    Vokenizazio testuingurua

    Testuetan oinarritutako ikaskuntza automatikoa (ML) bi programa erabiltzen dira maiz IA giza hizkuntza prozesatu eta ulertzeko trebatzeko: OpenAI-ren Generative Pre-trained Transformer 3 (GPT-3) eta Google-ren BERT (Bidirectional Encoder Representations from Transformers). AI terminologian, NLP prestakuntzan erabiltzen diren hitzei token deitzen zaie. Ipar Carolinako Unibertsitateko (UNC) ikertzaileek ikusi zuten testuetan oinarritutako prestakuntza-programak mugatuak direla ezin dutelako "ikusi", hau da, ezin dutela ikusizko informazioa eta komunikazioa harrapatu. 

    Adibidez, norbaitek GPT-3ri ardiaren kolorea zein den galdetzen badio, sistemak askotan "beltza" erantzungo du, nahiz eta argi eta garbi zuria izan. Erantzun hau testuan oinarritutako sistemak "ardi beltza" terminoarekin lotuko duelako da, kolore zuzena identifikatu beharrean. Tokenekin (voken) bisualak sartuz, AI sistemek terminoen ulermen oso bat izan dezakete. Vokenizazioak vokenak auto-gainbegiratutako NLP sistemetan integratzen ditu, "zentzu komuna" garatzeko aukera emanez.

    Hizkuntza-ereduak eta ordenagailu bidezko ikusmena integratzea ez da kontzeptu berria, eta azkar hedatzen ari den eremua da AI ikerketan. Bi AI mota hauen konbinazioak beraien indar indibidualak baliatzen ditu. GPT-3 bezalako hizkuntza ereduak gainbegiratu gabeko ikaskuntzaren bidez trebatzen dira, eta horri esker erraz eskalatzen dira. Aitzitik, objektuak ezagutzeko sistemak bezalako irudi ereduek errealitatetik zuzenean ikas dezakete eta ez dira testuak ematen duen abstrakzioan oinarritzen. Adibidez, irudi-ereduek ardi bat zuria dela antzeman dezakete irudi bati begiratuta.

    Eragin disruptiboa

    Vokenizazio prozesua nahiko erraza da. Vokenak hizkuntza-tokenei dagozkien irudiak edo garrantzitsuak esleituta sortzen dira. Ondoren, algoritmoak (vokenizer) bokenak sortzeko diseinatuta daude gainbegiratu gabeko ikaskuntzaren bidez (parametro/arau espliziturik gabe). Vokenizazioaren bidez trebatutako zentzu oneko IAk arazoak hobeto komunikatu eta ebatzi ditzake testuinguruaren ulermen sakonagoa baitute. Ikuspegi hau berezia da hizkuntza-tokenak iragartzen ez ezik, irudi-tokenak ere iragartzen dituelako, hau da, BERT eredu tradizionalek egin ezin duten zerbait.

    Adibidez, robot laguntzaileek irudiak ezagutu eta prozesuetan hobeto nabigatzeko gai izango dira, haiek eskatzen zaiena "ikusi" dezaketelako. Edukiak idazteko trebatutako adimen artifizialaren sistemak gizatiarrago soinua duten artikuluak landu ahal izango dituzte, hobeto isurtzen diren ideiekin, esaldi deskonektatuen ordez. NLP aplikazioen irismen zabala kontuan hartuta, vokenizazioak txat-botak, laguntzaile birtualak, lineako diagnostiko medikoak, itzultzaile digitalak eta abar hobetu ditzake.

    Gainera, ikusmenaren eta hizkuntzaren ikaskuntzaren konbinazioa ospea hartzen ari da irudi medikoen aplikazioetan, bereziki irudi medikoen diagnostiko automatizaturako. Esaterako, ikertzaile batzuk hurbilketa honekin esperimentatzen ari dira erradiografiako irudietan, testu-deskribapenekin batera, non segmentazio semantikoa denbora luzea izan daitekeen. Vokenization teknikak irudikapen horiek hobetu eta irudi mediko automatizatuak hobetu ditzake testu-informazioa erabiliz.

    Vokenizazio-eskaerak

    Vokenization aplikazio batzuk honako hauek izan daitezke:

    • Pantaila-argazkiak, argazkiak eta webgunearen edukia prozesatu ditzaketen txat-bot intuitiboak. Bezeroarentzako arretarako txat-botek, bereziki, produktuak eta zerbitzuak zehaztasunez gomendatzeko gai izan daitezke.
    • Irudiak eta bideoak prozesatu ditzaketen itzultzaile digitalak eta kultura- eta egoera-testuingurua kontuan hartzen dituen itzulpen zehatza eskaintzeko.
    • Sare sozialetako bot eskanerrek sentimenduen azterketa osoagoa egin dezakete irudiak, epigrafeak eta iruzkinak batuz. Aplikazio hau erabilgarria izan daiteke irudi kaltegarriak aztertzea eskatzen duten edukiak moderatzeko.
    • Ordenagailu bidezko ikusmenaren eta NLP ikaskuntza automatikoko ingeniarientzako eta datu-zientzialarientzako lan aukerak areagotzea.
    • Startupek AI sistema hauetan oinarritzen dira haiek komertzializatzeko edo enpresentzako irtenbide pertsonalizatuak eskaintzeko.

    Iruzkintzeko galderak

    • Bestela, nola uste duzu aldatuko duela vokenizazioak robotekin elkarreraginean?
    • Nola alda dezake vokenizazioak negozioak egiteko modua eta gure tramankuluekin (smartphones eta etxetresna adimendunak) elkarrekintzan jarduteko modua?

    Insight erreferentziak

    Ikuspegi honetarako honako lotura ezagun eta instituzional hauei erreferentzia egin zaie: