Vokenization taal ai kin sjen

Ofbyldingskredyt:

iStock

Vokenization: Taal dy't AI kin sjen

Mei ôfbyldings dy't no wurde opnaam yn training foar keunstmjittige yntelliginsje (AI) systemen, kinne robots ynkoarten kommando's "sjen".

Skriuwer:
Namme fan auteur
Quantumrun Foresight
Mei 9, 2023

Natuerlike taalferwurking (NLP) hat systemen foar keunstmjittige yntelliginsje (AI) ynskeakele om minsklike spraak te learen troch wurden te begripen en kontekst te passen oan it sentimint. It ienige nadeel is dat dizze NLP-systemen suver tekstbasearre binne. Vokenization is op it punt om dat alles te feroarjen.

Vokenization kontekst

Twa tekstbasearre masine-learen (ML)-programma's wurde faak brûkt om AI te trenen om minsklike taal te ferwurkjen en te begripen: OpenAI's Generative Pre-trained Transformer 3 (GPT-3) en Google's BERT (Bidirectional Encoder Representations from Transformers). Yn AI-terminology wurde de wurden brûkt yn NLP-training tokens neamd. Undersikers fan 'e Universiteit fan Noard-Karolina (UNC) observearre dat tekst-basearre trainingsprogramma's beheind binne om't se net kinne "sjen", wat betsjut dat se gjin fisuele ynformaasje en kommunikaasje kinne fange.

As immen bygelyks GPT-3 freget wat de kleur fan 'e skiep is, sil it systeem faak "swart" antwurdzje, sels as it dúdlik wyt is. Dit antwurd is om't it tekstbasearre systeem it sil assosjearje mei de term "swarte skiep" ynstee fan de juste kleur te identifisearjen. Troch fisuele op te nimmen mei tokens (voken), kinne AI-systemen in holistysk begryp fan termen hawwe. Vokenization yntegreart vokens yn selsbegeliede NLP-systemen, wêrtroch't se "sûn ferstân" kinne ûntwikkelje.

Yntegraasje fan taalmodellen en kompjûterfisy is gjin nij konsept, en it is in rap útwreidzjend fjild yn AI-ûndersyk. De kombinaasje fan dizze twa soarten AI makket gebrûk fan har yndividuele sterke punten. Taalmodellen lykas GPT-3 wurde oplaat troch learen sûnder tafersjoch, wêrtroch se maklik kinne skaalje. Yn tsjinstelling, byldmodellen lykas objektherkenningssystemen kinne direkt leare fan 'e realiteit en fertrouwe net op' e abstraksje fan 'e tekst. Bygelyks, byldmodellen kinne erkenne dat in skiep wyt is troch nei in foto te sjen.

Disruptive ynfloed

It proses fan vokenisaasje is frij ienfâldich. Vokens wurde makke troch it tawizen fan oerienkommende of relevante bylden oan taaltekens. Dan binne algoritmen (vokenizer) ûntworpen om vokens te generearjen fia learen sûnder tafersjoch (gjin eksplisite parameters / regels). Common sense AI oplaat troch vokenization kin kommunisearje en oplosse problemen better omdat se hawwe in mear yngeande begryp fan kontekst. Dizze oanpak is unyk om't it net allinich taaltokens foarsizze, mar ek byldtekens foarsizze, wat iets is dat tradisjonele BERT-modellen net kinne dwaan.

Robotyske assistinten kinne bygelyks ôfbyldings werkenne en prosessen better navigearje, om't se kinne "sjogge" wat der fan frege wurdt. Systemen foar keunstmjittige yntelliginsje dy't oplaat binne om ynhâld te skriuwen, sille artikels kinne meitsje dy't minskliker klinke, mei ideeën dy't better streame, ynstee fan disjoined sinnen. Sjoen it brede berik fan NLP-applikaasjes, kin vokenisaasje liede ta better prestearjende chatbots, firtuele assistinten, online medyske diagnoaze, digitale oersetters, en mear.

Dêrnjonken wint de kombinaasje fan fisy en taallearen populaasje yn medyske ôfbyldingsapplikaasjes, spesifyk foar automatisearre medyske bylddiagnoaze. Guon ûndersikers eksperimintearje bygelyks mei dizze oanpak op röntgenôfbyldings mei byhearrende tekstbeskriuwings, wêrby't semantyske segmentaasje tiidslinend kin wêze. De vokenisaasjetechnyk koe dizze foarstellingen ferbetterje en automatisearre medyske ôfbylding ferbetterje troch de tekstynformaasje te brûken.

Applikaasjes foar vokenization

Guon applikaasjes foar vokenisaasje kinne omfetsje:

Yntuïtive chatbots dy't screenshots, ôfbyldings en webside-ynhâld kinne ferwurkje. Chatbots foar klantstipe kinne benammen produkten en tsjinsten sekuer oanbefelje.
Digitale oersetters dy't ôfbyldings en fideo's kinne ferwurkje en in krekte oersetting leverje dy't kulturele en situasjonele kontekst beskôgje.
Sosjale media-botscanners kinne in mear holistyske sentimintanalyse útfiere troch ôfbyldings, ûnderskriften en opmerkingen te fusearjen. Dizze applikaasje kin nuttich wêze yn ynhâldmoderaasje dy't de analyze fan skealike ôfbyldings fereasket.
Ferheegjen fan wurkgelegenheidsmooglikheden foar komputerfisy en NLP-masine-learen-yngenieurs en gegevenswittenskippers.
Startups dy't bouwe op dizze AI-systemen om se te kommersjalisearjen of oanpaste oplossingen foar bedriuwen te leverjen.

Fragen om reaksjes te jaan

Hoe oars tinke jo dat vokenisaasje sil feroarje hoe't wy omgean mei robots?
Hoe kin vokenisaasje feroarje hoe't wy saken dogge en ynteraksje mei ús gadgets (smartphones en tûke apparaten)?

Add to list