Vokenization: Taal wat KI kan sien

BEELDKREDIET:
Image krediet
iStock

Vokenization: Taal wat KI kan sien

Vokenization: Taal wat KI kan sien

Subopskrif teks
Met beelde wat nou in kunsmatige intelligensie (KI) stelselopleiding opgeneem word, kan robotte dalk binnekort opdragte "sien".
    • Author:
    • Author naam
      Quantumrun Foresight
    • Mag 9, 2023

    Natuurlike taalverwerking (NLP) het kunsmatige intelligensie (AI) stelsels in staat gestel om menslike spraak te leer deur woorde te verstaan ​​en konteks met die sentiment te pas. Die enigste nadeel is dat hierdie NLP-stelsels suiwer teksgebaseer is. Vokenization is op die punt om dit alles te verander.

    Vokenisering konteks

    Twee teksgebaseerde masjienleerprogramme (ML) word dikwels gebruik om KI op te lei om menslike taal te verwerk en te verstaan: OpenAI se Generative Pre-trained Transformer 3 (GPT-3) en Google se BERT (Bidirectional Encoder Representations from Transformers). In KI-terminologie word die woorde wat in NLP-opleiding gebruik word, tokens genoem. Navorsers van die Universiteit van Noord-Carolina (UNC) het opgemerk dat teksgebaseerde opleidingsprogramme beperk is omdat hulle nie kan "sien", wat beteken dat hulle nie visuele inligting en kommunikasie kan vaslê nie. 

    Byvoorbeeld, as iemand vir GPT-3 vra wat die kleur van die skaap is, sal die stelsel dikwels "swart" antwoord al is dit duidelik wit. Hierdie reaksie is omdat die teksgebaseerde stelsel dit met die term "swartskaap" sal assosieer in plaas daarvan om die korrekte kleur te identifiseer. Deur beeldmateriaal met tekens (voken) in te sluit, kan KI-stelsels 'n holistiese begrip van terme hê. Vokenization integreer vokens in self-toesig NLP-stelsels, wat hulle in staat stel om "gesonde verstand" te ontwikkel.

    Die integrasie van taalmodelle en rekenaarvisie is nie 'n nuwe konsep nie, en dit is 'n vinnig groeiende veld in KI-navorsing. Die kombinasie van hierdie twee tipes KI maak gebruik van hul individuele sterkpunte. Taalmodelle soos GPT-3 word opgelei deur leer sonder toesig, wat hulle in staat stel om maklik te skaal. Daarteenoor kan beeldmodelle soos objekherkenningstelsels direk uit die werklikheid leer en nie staatmaak op die abstraksie wat deur die teks verskaf word nie. Beeldmodelle kan byvoorbeeld herken dat 'n skaap wit is deur na 'n prentjie te kyk.

    Ontwrigtende impak

    Die proses van vokenisering is redelik eenvoudig. Vokens word geskep deur ooreenstemmende of relevante beelde aan taaltokens toe te ken. Dan word algoritmes (vokenizer) ontwerp om vokens te genereer deur leer sonder toesig (geen eksplisiete parameters/reëls). Gesonde verstand KI wat deur vokenisering opgelei is, kan probleme beter kommunikeer en oplos omdat hulle 'n meer in-diepte begrip van konteks het. Hierdie benadering is uniek omdat dit nie net taaltokens voorspel nie, maar ook beeldtekens voorspel, wat iets is wat tradisionele BERT-modelle nie kan doen nie.

    Robotassistente sal byvoorbeeld beelde kan herken en prosesse beter kan navigeer omdat hulle kan "sien" wat van hulle vereis word. Kunsmatige intelligensiestelsels wat opgelei is om inhoud te skryf, sal artikels kan skep wat meer menslik klink, met idees wat beter vloei, in plaas van onsamehangende sinne. Met inagneming van die wye omvang van NLP-toepassings, kan vokenisering lei tot beter presterende kletsbotte, virtuele assistente, aanlyn mediese diagnoses, digitale vertalers, en meer.

    Boonop word die kombinasie van visie en taalleer gewild in mediese beeldtoepassings, spesifiek vir outomatiese mediese beelddiagnose. Sommige navorsers eksperimenteer byvoorbeeld met hierdie benadering op radiografiebeelde met gepaardgaande teksbeskrywings, waar semantiese segmentering tydrowend kan wees. Die vokeniseringstegniek kan hierdie voorstellings verbeter en outomatiese mediese beeldvorming verbeter deur die teksinligting te gebruik.

    Aansoeke vir vokenisering

    Sommige toepassings vir vokenisering kan die volgende insluit:

    • Intuïtiewe kletsbotte wat skermkiekies, prente en webwerf-inhoud kan verwerk. Veral kliëntedienskletsbotte kan produkte en dienste akkuraat aanbeveel.
    • Digitale vertalers wat beelde en video's kan verwerk en 'n akkurate vertaling verskaf wat kulturele en situasionele konteks in ag neem.
    • Sosiale media-botskandeerders wat 'n meer holistiese sentimentanalise kan uitvoer deur beelde, onderskrifte en opmerkings saam te voeg. Hierdie toepassing kan nuttig wees in inhoudmoderering wat die ontleding van skadelike beelde vereis.
    • Verhoogde werksgeleenthede vir rekenaarvisie en NLP-masjienleeringenieurs en datawetenskaplikes.
    • Startups wat op hierdie KI-stelsels bou om dit te kommersialiseer of pasgemaakte oplossings vir besighede te verskaf.

    Vrae om op kommentaar te lewer

    • Hoe anders dink jy sal vokenisering die manier waarop ons met robotte omgaan, verander?
    • Hoe kan vokenisering verander hoe ons sake doen en met ons toestelle (slimfone en slimtoestelle) omgaan?

    Insig verwysings

    Die volgende gewilde en institusionele skakels is vir hierdie insig verwys: