Ikaskuntza-prozesu bateratuak: norberak gainbegiratzen duen ikaskuntza koherentea izan daiteke azkenean

IRUDIAREN KREDITUA:
Irudiaren kreditu
iStock

Ikaskuntza-prozesu bateratuak: norberak gainbegiratzen duen ikaskuntza koherentea izan daiteke azkenean

Ikaskuntza-prozesu bateratuak: norberak gainbegiratzen duen ikaskuntza koherentea izan daiteke azkenean

Azpitituluaren testua
Azkenean, ikertzaileek sarrera baten bidez algoritmoak entrenatzeko modu bat aurkitu dute datu mota edo formatua edozein dela ere.
    • Egilea:
    • Egilearen izena
      Quantumrun Prospektiba
    • Otsailaren 7, 2023

    Sare neuronal sakonak tradizionalki onak izan dira argazki eta bideoetan objektuak identifikatzeko, baita hizkuntza naturala prozesatzeko ere. Hala ere, norberaren gainbegiratu diren algoritmoen inguruko ikerketa gehienak modalitate indibidualetan zentratu dira, eta horrek alborapena ekar dezake.

    Ikaskuntza prozesu bateratuak testuingurua

    Norberak gainbegiratuta, ordenagailuek beren ingurua ezagutu dezakete, haiek aztertuz eta irudien, audio-grabazioen edo idatzizko hitzen esanahia eraikiz. Eraginkorragoa da irudiak hautemateko edo ahozko hizkuntza ulertzeko eskuzko jarraibiderik behar ez duten makinak edukitzea. Norberak gainbegiratzen duen ikaskuntza-ikerketa gehienek arlo bakarrean oinarritzen dira, modalitate anitzetan baino. Hori dela eta, arlo batean zentratzen diren ikertzaileek beste estrategia bat izan ohi dute beste batean zentratzen direnek baino.

    Adibidez, hizketa-prozesamenduan, norberak gainbegiraturiko ikaskuntza-zeregin batzuek ez dute hizketa-unitateen hiztegirik. Ondorioz, hainbat eredu hizkera-unitateen inbentarioa ikasten duten mekanismoekin datoz. Tokenak ikastea, sarrera atzera egitea edo datuak handitzea dira ordenagailu bidezko ikusmenaren ikertzaileek arazo honi aurre egiten saiatu izan diren modu batzuk. Hala ere, askotan zaila da jakitea metodo hauek eraginkorrak izango diren jatorrizko testuingurutik kanpo.

    2022ko Cornell Unibertsitateko ikerketa baten arabera, ikaskuntzaren biologiari buruzko teori nagusiek iradokitzen dute gizakiek ziurrenik antzeko prozesuak erabiltzen dituztela bisualak eta hizkuntza ulertzeko. Era berean, neurona-sareen arkitektura orokorrek modalitate espezifikoen parekoak gainditu dituzte. Horrela, 2022an, Metak Data2vec aurkeztu zuen, algoritmo bakarra erabiltzen duen sistema bat sare neuronal bat irudiak, testuak edo hizketa ezagutzeko entrenatzeko. 

    Eragin disruptiboa

    Algoritmoek irudiak, testuak eta ahotsa modu ezberdinean prozesatzen dituzte, pixelak, token bisualak, hitzak edo soinu-inbentarioak bezalako unitate desberdinak aurreikusten dituztelako. Algoritmoen sorrera modalitate jakin batekin dago lotuta, hau da, modalitate ezberdinetan daudenek elkarrengandik ezberdin lanean jarraituko dute. Data2vec-ek ereduei sarrera mota ezberdinekin funtzionatzeko aukera ematen die, irudikapenetan arreta jarriz, adibidez, sare neuronal baten geruzetan. Data2vec-ekin, ez dago token bisualak, esaldiak edo soinuak aurreikusteko beharrik.

    Data2vec-ek adierazten du auto-irakaskuntzako algoritmo batek agertoki anitzetan ondo funtziona dezakeela, baina askotan metodo tradizionalagoak baino hobeto funtziona dezakeela. Ezaugarri honek norberak gainbegiraturiko ikaskuntzaren erabilera zabalagoa ekar dezake eta gai konplexuei buruz beren buruak irakatsi ditzaketen AI makinetara hurbildu gaitezke, hala nola kirol ekitaldiak edo filmak, artikuluak eta audio-grabaketak erabiliz ogia prestatzeko modu desberdinak.

    Nature aldizkarian argitaratutako 2022ko artikulu batean, ikertzaileek auto-gainbegiratutako ikaskuntzaren aplikazio itxaropentsuak nabarmendu zituzten datu multzo multimodalak erabiltzen dituzten ereduak garatzeko. Ikerketak beren prestakuntzarako datu alboratuak biltzeko erronka batzuk ere eztabaidatu zituen, hala nola medikuntzan eta osasungintzan erabiltzen diren metodoak. Norberaren gainbegiratuta dagoen ikaskuntzarekin, taldeak etiketarik gabeko datuak soilik erabiliz irakatsi diezaieke makinei. Balentria hau abiapuntu bikaina da medikuntzako edozein zereginetarako (eta haratago) argi sailkatu ezin den ezkutuko informazioa aurreikusteko. Etorkizunean, algoritmoek sarrera irekiak hobeto ezagutzeko eta beste datu multzo batzuekin erlazionatzeko gai izango dira gizakiaren esku-hartzerik gabe.

    Ikasketa prozesu bateratuaren ondorioak

    Ikasketa bateratu prozesuen ondorio zabalagoak honako hauek izan daitezke: 

    • Gomendioak egin eta produktuak identifikatu ditzaketen txat-botak pantaila-argazkietan eta ahots-grabaketetan oinarrituta.
    • Ikus-entzunezko informazioa aldi berean prozesatu dezaketen laguntzaile digitalak, zerbitzu eta erantzun zehatzagoak lortzeko.
    • Metabertsoan sortutako pertsonaia birtualak eta lagunak, gizakiekin interakzioan ikasi eta, azkenean, pertsonekin gero eta errealagoa den moduan hitz egin eta hitz egiten dute. 
    • Audio- eta ikus-entzunezko seinaleetan oinarrituta autoabiaraz daitezkeen tresna adimendunak.
    • Ibilgailu autonomoen gaitasun hobetuak, errepideko objektuak zehaztasunez identifikatzeko edo poliziaren eta anbulantziaren sirenei erantzuteko.
    • Laguntza-teknologia hobea, ikus-entzunezko edo ikusmen urritasuna duten pertsonak beren independentzia eta mugikortasuna hobetzera bideratzen lagun dezakeena.

    Iruzkintzeko galderak

    • Bestela nola sor ditzake teknologia honek gailu eta laguntzaile digital intuitiboagoak?
    • Zeintzuk dira AI multimodalak lanean laguntzeko beste modu batzuk?