Јазик за вокенизација тој може да види

КРЕДИТ НА СЛИКА:

iStock

Вокенизација: Јазик што вештачката интелигенција може да го види

Со оглед на тоа што сликите сега се вградени во обуката на системите за вештачка интелигенција (ВИ), роботите наскоро би можеле да „видат“ команди.

автор:
име на авторот
Quantumrun Foresight
Може 9, 2023

Обработката на природниот јазик (NLP) им овозможи на системите за вештачка интелигенција (AI) да учат човечки говор со разбирање на зборовите и усогласување на контекстот со чувството. Единствениот недостаток е тоа што овие НЛП системи се чисто базирани на текст. Вокенизацијата ќе го промени сето тоа.

Контекс на вокенизација

Две програми за машинско учење (ML) базирани на текст често се користат за обука на вештачката интелигенција да го обработува и разбира човечкиот јазик: генеративен претходно обучен трансформатор 3 (GPT-3) на OpenAI и BERT на Google (Двонасочни енкодерски претстави од трансформатори). Во терминологијата за вештачка интелигенција, зборовите што се користат во обуката за НЛП се нарекуваат токени. Истражувачите од Универзитетот во Северна Каролина (UNC) забележале дека програмите за обука базирани на текст се ограничени бидејќи не можат да „видат“, што значи дека не можат да доловат визуелни информации и комуникација.

На пример, ако некој го праша GPT-3 која е бојата на овците, системот често ќе одговори „црно“ дури и ако е јасно бело. Овој одговор е затоа што системот заснован на текст ќе го поврзе со терминот „црна овца“ наместо да ја идентификува точната боја. Со инкорпорирање на визуелни слики со токени (вокени), системите за вештачка интелигенција можат да имаат сеопфатно разбирање на термините. Вокенизацијата ги интегрира вокените во само-надгледуваните НЛП системи, овозможувајќи им да развијат „здрав разум“.

Интегрирањето на јазичните модели и компјутерската визија не е нов концепт и е поле кое брзо се шири во истражувањето на вештачката интелигенција. Комбинацијата на овие два типа на вештачка интелигенција ги користи нивните индивидуални сили. Јазичните модели како GPT-3 се обучуваат преку учење без надзор, што им овозможува лесно да се скалираат. Спротивно на тоа, моделите на слики како што се системите за препознавање објекти можат директно да учат од реалноста и не се потпираат на апстракцијата што ја дава текстот. На пример, моделите на слики можат да препознаат дека овцата е бела гледајќи ја сликата.

Нарушувачко влијание

Процесот на вокенизација е прилично јасен. Вокените се создаваат со доделување соодветни или релевантни слики на јазичните токени. Потоа, алгоритмите (вокенизатор) се дизајнирани да генерираат вокени преку учење без надзор (без експлицитни параметри/правила). Здравиот разум вештачката интелигенција обучена преку вокенизација може подобро да комуницира и да ги решава проблемите бидејќи тие имаат подлабоко разбирање на контекстот. Овој пристап е уникатен затоа што не само што предвидува јазични токени туку предвидува и токени за слики, што е нешто што традиционалните модели на BERT не можат да го направат.

На пример, роботските асистенти ќе можат подобро да препознаваат слики и подобро да се движат низ процесите бидејќи можат да „видат“ што се бара од нив. Системите за вештачка интелигенција обучени да пишуваат содржини ќе можат да создаваат статии што звучат почовечно, со идеи што течат подобро, наместо со разделени реченици. Со оглед на широкиот дофат на NLP апликациите, вокенизацијата може да доведе до подобри перформанси на чет-ботови, виртуелни асистенти, онлајн медицински дијагнози, дигитални преведувачи и многу повеќе.

Дополнително, комбинацијата на видот и учењето јазик добива на популарност во апликациите за медицинска слика, особено за автоматска дијагноза на медицинска слика. На пример, некои истражувачи експериментираат со овој пристап на слики од радиографија со придружни описи на текст, каде што семантичката сегментација може да одземе време. Техниката на вокенизација може да ги подобри овие претстави и да го подобри автоматизираното медицинско сликање со користење на текстуални информации.

Апликации за вокенизација

Некои апликации за вокенизација може да вклучуваат:

Интуитивни чат-ботови кои можат да обработуваат слики од екранот, слики и содржина на веб-локација. Конкретно, чет-ботите за поддршка на клиентите може точно да препорачаат производи и услуги.
Дигитални преведувачи кои можат да обработуваат слики и видеа и да обезбедат точен превод кој го зема предвид културниот и ситуацискиот контекст.
Скенери за ботови на социјалните мрежи можат да спроведат похолистичка анализа на чувствата со спојување на слики, натписи и коментари. Оваа апликација може да биде корисна во умереноста на содржината што бара анализа на штетни слики.
Зголемување на можностите за вработување за инженери за компјутерска визија и машинско учење НЛП и научници за податоци.
Стартапи кои ги градат овие системи со вештачка интелигенција за да ги комерцијализираат или да обезбедат приспособени решенија за бизнисите.

Прашања за коментирање

Како инаку мислите дека вокенизацијата ќе го промени начинот на кој комуницираме со роботите?
Како може вокенизацијата да го промени начинот на кој водиме бизнис и комуницираме со нашите гаџети (паметни телефони и паметни апарати)?

Додади во Листа