Vokenization: Lugha ambayo AI inaweza kuona

MKOPO WA PICHA:
Mkopo wa picha
Stock

Vokenization: Lugha ambayo AI inaweza kuona

Vokenization: Lugha ambayo AI inaweza kuona

Maandishi ya kichwa kidogo
Kwa kuwa sasa picha zimejumuishwa katika mafunzo ya mifumo ya akili bandia (AI), roboti hivi karibuni zinaweza "kuona" amri.
    • mwandishi:
    • mwandishi jina
      Mtazamo wa Quantumrun
    • Huenda 9, 2023

    Uchakataji wa lugha asilia (NLP) umewezesha mifumo ya akili bandia (AI) kujifunza usemi wa binadamu kwa kuelewa maneno na kulinganisha muktadha na hisia. Kando pekee ni kwamba mifumo hii ya NLP inategemea maandishi tu. Vokenization inakaribia kubadilisha hayo yote.

    Muktadha wa uhamasishaji

    Programu mbili za mashine za kujifunza kulingana na maandishi (ML) mara nyingi hutumiwa kufunza AI kuchakata na kuelewa lugha ya binadamu: OpenAI's Generative Pre-trained Transformer 3 (GPT-3) na BERT ya Google (Bidirectional Encoder Representations kutoka Transfoma). Katika istilahi ya AI, maneno yanayotumiwa katika mafunzo ya NLP yanaitwa ishara. Watafiti kutoka Chuo Kikuu cha North Carolina (UNC) waliona kuwa programu za mafunzo ya maandishi ni ndogo kwa sababu hawawezi "kuona," kumaanisha kwamba hawawezi kunasa taarifa za kuona na mawasiliano. 

    Kwa mfano, ikiwa mtu anauliza GPT-3 rangi ya kondoo ni nini, mfumo mara nyingi utajibu "nyeusi" hata ikiwa ni nyeupe wazi. Jibu hili ni kwa sababu mfumo wa msingi wa maandishi utauhusisha na neno "kondoo mweusi" badala ya kutambua rangi sahihi. Kwa kujumuisha taswira na ishara (zilizoombwa), mifumo ya AI inaweza kuwa na uelewa wa jumla wa maneno. Vokenization inaunganisha vokens katika mifumo ya NLP inayojidhibiti, na kuwaruhusu kukuza "akili ya kawaida."

    Kuunganisha miundo ya lugha na maono ya kompyuta si dhana mpya, na ni uwanja unaopanuka kwa kasi katika utafiti wa AI. Mchanganyiko wa aina hizi mbili za AI huongeza nguvu zao za kibinafsi. Miundo ya lugha kama vile GPT-3 hufunzwa kupitia ujifunzaji usiosimamiwa, ambayo huwaruhusu kuongeza kwa urahisi. Kinyume chake, miundo ya picha kama mifumo ya utambuzi wa kitu inaweza kujifunza moja kwa moja kutoka kwa uhalisia na haitegemei uondoaji unaotolewa na maandishi. Kwa mfano, mifano ya picha inaweza kutambua kwamba kondoo ni nyeupe kwa kuangalia picha.

    Athari ya usumbufu

    Mchakato wa kufanya vokenization ni rahisi sana. Vokens huundwa kwa kugawa picha zinazolingana au zinazofaa kwa ishara za lugha. Kisha, algorithms (vokenizer) imeundwa ili kutoa vokens kupitia ujifunzaji usiosimamiwa (hakuna vigezo / sheria wazi). AI ya akili ya kawaida iliyofunzwa kupitia kutamka inaweza kuwasiliana na kutatua matatizo vizuri zaidi kwa sababu wana ufahamu wa kina zaidi wa muktadha. Mbinu hii ni ya kipekee kwa sababu haibashiri ishara za lugha pekee bali pia inatabiri ishara za picha, jambo ambalo miundo ya kitamaduni ya BERT haiwezi kufanya.

    Kwa mfano, wasaidizi wa roboti wataweza kutambua picha na kuvinjari michakato vyema zaidi kwa sababu wanaweza "kuona" kile kinachohitajika kwao. Mifumo ya akili Bandia iliyofunzwa kuandika maudhui itaweza kutengeneza makala ambayo yanasikika kuwa ya kibinadamu zaidi, yenye mawazo yanayotiririka vyema, badala ya sentensi zisizounganishwa. Kwa kuzingatia ufikiaji mpana wa programu za NLP, utambulisho unaweza kusababisha chatbots zinazofanya kazi vizuri, wasaidizi pepe, utambuzi wa matibabu mkondoni, watafsiri dijiti, na zaidi.

    Zaidi ya hayo, mseto wa maono na ujifunzaji wa lugha unazidi kupata umaarufu katika matumizi ya picha za kimatibabu, mahususi kwa utambuzi wa picha za matibabu otomatiki. Kwa mfano, watafiti wengine wanajaribu mbinu hii kwenye picha za radiografu na maelezo ya maandishi yanayoambatana, ambapo sehemu za semantic zinaweza kuchukua muda. Mbinu ya kutamka inaweza kuimarisha uwakilishi huu na kuboresha taswira ya kiatomati ya matibabu kwa kutumia maelezo ya maandishi.

    Maombi kwa ajili ya vokenization

    Baadhi ya maombi ya utambulisho yanaweza kujumuisha:

    • Chatbots angavu ambazo zinaweza kuchakata picha za skrini, picha na maudhui ya tovuti. Chatbots za usaidizi kwa wateja, haswa, zinaweza kupendekeza bidhaa na huduma kwa usahihi.
    • Watafsiri dijitali ambao wanaweza kuchakata picha na video na kutoa tafsiri sahihi inayozingatia muktadha wa kitamaduni na hali.
    • Vichanganuzi vya roboti vya mitandao ya kijamii vinaweza kufanya uchanganuzi kamili wa maoni kwa kuunganisha picha, maelezo mafupi na maoni. Programu hii inaweza kuwa muhimu katika udhibiti wa maudhui unaohitaji uchanganuzi wa picha hatari.
    • Kuongeza fursa za ajira kwa maono ya kompyuta na wahandisi wa kujifunza mashine ya NLP na wanasayansi wa data.
    • Waanzishaji wanaojenga kwenye mifumo hii ya AI ili kuifanya kibiashara au kutoa suluhu zilizobinafsishwa kwa biashara.

    Maswali ya kutoa maoni

    • Je, unadhani ni kwa njia gani nyingine utambulisho utabadilisha jinsi tunavyoingiliana na roboti?
    • Je, utambulisho unawezaje kubadilisha jinsi tunavyofanya biashara na kuingiliana na vifaa vyetu (simu mahiri na vifaa mahiri)?

    Marejeleo ya maarifa

    Viungo vifuatavyo maarufu na vya kitaasisi vilirejelewa kwa maarifa haya: