Eenvormige leerprosesse self-toesig leer kan uiteindelik konsekwent word

BEELDKREDIET:

iStock

Eenvormige leerprosesse: Self-toesig leer kan uiteindelik konsekwent word

GEBOU VIR MORE SE TOEKOMS

Die Quantumrun Trends Platform sal jou die insigte, gereedskap en gemeenskap gee om toekomstige neigings te verken en te floreer.

SPESIALE AANBOD

$5 PER MAAND

Teken vandag in

Bekyk alle voordele

Eenvormige leerprosesse: Self-toesig leer kan uiteindelik konsekwent word

Navorsers het uiteindelik 'n manier ontdek om algoritmes op te lei deur een inset, ongeag die tipe data of formaat.

Author:
Author naam
Quantumrun Foresight
7 Februarie 2023

Diep neurale nette was tradisioneel goed om voorwerpe in foto's en video's te identifiseer, asook om natuurlike taal te verwerk. Die meeste navorsing rondom self-toesig algoritmes het egter op individuele modaliteite gekonsentreer, wat tot vooroordeel kan lei.

Verenigde leerprosesse konteks

Deur selftoesig te hou, kan rekenaars van hul omgewing leer deur dit te ondersoek en die betekenis van beelde, oudio-opnames of geskrewe woorde te konstrueer. Dit is meer doeltreffend om masjiene te hê wat nie handmatige instruksies nodig het om prente te onderskei of gesproke taal te verstaan nie. Die meeste self-toesig leernavorsing fokus op een area eerder as veelvuldige modaliteite. Navorsers wat op een gebied fokus, het dus dikwels 'n heeltemal ander strategie as dié wat op 'n ander fokus.

Byvoorbeeld, in spraakverwerking het sommige selftoesig leertake nie 'n woordeskat van spraakeenhede nie. As gevolg hiervan kom verskeie modelle met meganismes wat 'n inventaris van spraakeenhede aanleer. Die aanleer van tekens, die terugvoering van die invoer of die aanvulling van data is 'n paar maniere waarop rekenaarvisie-navorsers probeer het om hierdie probleem in die verlede te bekamp. Dit is egter dikwels moeilik om te sê of hierdie metodes effektief sal wees buite die oorspronklike konteks.

Volgens 'n 2022 Cornell Universiteit-studie dui topteorieë oor die biologie van leer daarop dat mense waarskynlik soortgelyke prosesse gebruik om beide beeldmateriaal en taal te verstaan. Net so het algemene neurale netwerkargitekture beter gevaar as modaliteitspesifieke eweknieë. As sodanig het Meta in 2022 Data2vec bekendgestel, 'n stelsel wat 'n enkele algoritme gebruik om 'n neurale netwerk op te lei om beelde, teks of spraak te herken.

Ontwrigtende impak

Algoritmes verwerk beelde, teks en stem anders omdat hulle verskillende eenhede soos pixels, visuele tekens, woorde of klankvoorraad verwag. Die skepping van algoritmes hou verband met 'n bepaalde modaliteit, wat beteken dat diegene in verskillende modaliteite sal voortgaan om anders as mekaar te werk. Data2vec laat modelle toe om met verskillende invoertipes te werk deur te fokus op voorstellings, soos die lae van 'n neurale netwerk. Met data2vec is dit nie nodig om visuele tekens, frases of klanke te voorspel nie.

Data2vec dui aan dat 'n selfonderrig-algoritme nie net goed oor verskeie scenario's kan werk nie, maar dikwels beter doen as meer tradisionele metodes. Hierdie kenmerk kan lei tot groter gebruik van selftoesig leer en bring ons nader aan KI-masjiene wat hulself kan leer oor komplekse onderwerpe soos sportbyeenkomste of verskillende maniere om brood te bak deur flieks, artikels en oudio-opnames te gebruik.

In 'n 2022-artikel wat in Nature-joernaal gepubliseer is, het die navorsers belowende toepassings van self-toesig leer uitgelig vir die ontwikkeling van modelle wat multimodale datastelle gebruik. Die studie het ook 'n paar uitdagings bespreek in die insameling van onbevooroordeelde data vir hul opleiding, soos metodes wat in medisyne en gesondheidsorg gebruik word. Met self-toesig leer kon die span masjiene onderrig deur slegs ongemerkte data te gebruik. Hierdie prestasie is 'n goeie beginpunt vir enige taak binne medisyne (en verder) om verborge inligting te voorspel wat nie duidelik gekategoriseer kan word nie. In die toekoms sal algoritmes oopeinde-insette beter kan herken en dit met ander datastelle kan verbind sonder menslike ingryping.

Implikasies van verenigde leerprosesse

Wyer implikasies van verenigde leerprosesse kan die volgende insluit:

Chatbots wat aanbevelings kan maak en produkte kan identifiseer op grond van skermkiekies en stemopnames.
Digitale assistente wat visuele en oudio-inligting gelyktydig kan verwerk, wat lei tot meer akkurate dienste en antwoorde.
Virtuele karakters en vriende geskep in die metaverse wat kan leer deur interaksie met mense en uiteindelik betrokke raak en met mense gesels op maniere wat al hoe meer lewensgetrou voel.
Slim toestelle wat self kan begin op grond van oudio- en visuele leidrade.
Verbeterde outonome voertuigvermoëns wat voorwerpe op die pad akkuraat kan identifiseer of dienooreenkomstig op polisie- en ambulanssirenes kan reageer.
Beter ondersteunende tegnologie wat kan help om mense met oudio- of visuele gestremdhede te lei om hul onafhanklikheid en mobiliteit te verbeter.

Vrae om op kommentaar te lewer

Hoe anders kan hierdie tegnologie meer intuïtiewe toestelle en digitale assistente skep?
Wat is 'n paar ander maniere waarop multimodale KI jou by die werk kan help?

Voeg by lys