Vokenization: Pinulongan nga makita sa AI

IMAHE CREDIT:
Kredito sa litrato
iStock

Vokenization: Pinulongan nga makita sa AI

Vokenization: Pinulongan nga makita sa AI

Subheading nga teksto
Uban sa mga imahe nga gilakip na karon sa pagbansay sa mga sistema sa artificial intelligence (AI), ang mga robot sa dili madugay mahimo nga "makakita" nga mga mando.
    • Author:
    • Ngalan sa tagsulat
      Quantumrun Foresight
    • Hinaot 9, 2023

    Ang natural nga pagproseso sa pinulongan (NLP) nakapahimo sa mga sistema sa artificial intelligence (AI) nga makakat-on sa sinultihan sa tawo pinaagi sa pagsabot sa mga pulong ug pagpares sa konteksto sa sentimento. Ang bugtong kalisud mao nga kini nga mga sistema sa NLP puro nga nakabase sa teksto. Ang vokenization hapit na magbag-o sa tanan.

    Konteksto sa Vokenization

    Duha ka text-based machine learning (ML) nga mga programa ang sagad gigamit sa pagbansay sa AI sa pagproseso ug pagsabot sa tawhanong pinulongan: OpenAI's Generative Pre-trained Transformer 3 (GPT-3) ug Google's BERT (Bidirectional Encoder Representations from Transformers). Sa terminolohiya sa AI, ang mga pulong nga gigamit sa pagbansay sa NLP gitawag nga mga token. Ang mga tigdukiduki gikan sa University of North Carolina (UNC) nakaobserbar nga ang mga programa sa pagbansay nga nakabase sa teksto limitado tungod kay dili sila "makakita," nagpasabut nga dili nila makuha ang biswal nga impormasyon ug komunikasyon. 

    Pananglitan, kung adunay mangutana sa GPT-3 kung unsa ang kolor sa karnero, ang sistema kanunay nga motubag sa "itom" bisan kung kini klaro nga puti. Kini nga tubag kay tungod kay ang text-based nga sistema mag-associate niini sa terminong "black sheep" kay sa pag-ila sa saktong kolor. Pinaagi sa pag-apil sa mga biswal nga adunay mga token (voken), ang mga sistema sa AI mahimong adunay usa ka holistic nga pagsabut sa mga termino. Ang Vokenization nag-integrate sa mga voken ngadto sa self-supervised NLP systems, nga nagtugot kanila sa pagpalambo sa "common sense."

    Ang paghiusa sa mga modelo sa lengguwahe ug panan-aw sa kompyuter dili usa ka bag-ong konsepto, ug kini usa ka paspas nga pagpalapad sa natad sa panukiduki sa AI. Ang kombinasyon niining duha ka matang sa AI naggamit sa ilang tagsa-tagsa ka kusog. Ang mga modelo sa lengguwahe sama sa GPT-3 gibansay pinaagi sa wala gibantayan nga pagkat-on, nga nagtugot kanila sa pagsukod sa kadali. Sa kasukwahi, ang mga modelo sa imahe sama sa mga sistema sa pag-ila sa butang direktang makakat-on gikan sa kamatuoran ug dili magsalig sa abstraction nga gihatag sa teksto. Pananglitan, ang mga modelo sa imahe makaila nga ang usa ka karnero puti pinaagi sa pagtan-aw sa usa ka litrato.

    Makasamok nga epekto

    Ang proseso sa vokenization medyo prangka. Ang mga Voken gihimo pinaagi sa pag-assign sa katugbang o may kalabutan nga mga imahe sa mga token sa pinulongan. Dayon, ang mga algorithm (vokenizer) gidesinyo aron makamugna og mga voken pinaagi sa wala'y pagdumala nga pagkat-on (walay klaro nga mga parameter / lagda). Ang sentido komon nga AI nga gibansay pinaagi sa vokenization makakomunikar ug makasulbad sa mga problema nga mas maayo tungod kay sila adunay mas lawom nga pagsabot sa konteksto. Kini nga pamaagi talagsaon tungod kay dili lamang kini nagtagna sa mga token sa pinulongan apan nagtagna usab sa mga token sa imahe, nga usa ka butang nga dili mahimo sa tradisyonal nga mga modelo sa BERT.

    Pananglitan, ang mga robotic assistant makahimo sa pag-ila sa mga imahe ug pag-navigate sa mga proseso nga mas maayo tungod kay sila "makakita" kung unsa ang gikinahanglan kanila. Ang mga sistema sa artificial intelligence nga gibansay sa pagsulat sa sulod makahimo sa paghimo og mga artikulo nga mas paminawon sa tawo, nga adunay mga ideya nga mas maayo nga modagayday, imbes nga mga disjointed sentences. Sa pagkonsiderar sa halapad nga pag-abot sa mga aplikasyon sa NLP, ang vokenization mahimong mosangpot sa mas maayo nga performance sa mga chatbots, virtual assistants, online medical diagnoses, digital translators, ug uban pa.

    Dugang pa, ang kombinasyon sa panan-awon ug pagkat-on sa pinulongan nagkapopular sa mga aplikasyon sa medikal nga imaging, ilabi na alang sa automated nga medikal nga pagdayagnos sa imahe. Pananglitan, ang pipila ka mga tigdukiduki nag-eksperimento niini nga pamaagi sa mga hulagway sa radiograph nga adunay kauban nga mga deskripsyon sa teksto, diin ang semantic segmentation mahimong makagugol sa panahon. Ang teknik sa vokenization makapausbaw niini nga mga representasyon ug makapauswag sa automated medical imaging pinaagi sa paggamit sa impormasyon sa teksto.

    Mga aplikasyon alang sa vokenization

    Ang ubang mga aplikasyon alang sa vokenization mahimong maglakip sa:

    • Mga intuitive nga chatbots nga makaproseso sa mga screenshot, hulagway, ug sulod sa website. Ang mga chatbot sa suporta sa kostumer, labi na, mahimong tukma nga makarekomenda sa mga produkto ug serbisyo.
    • Ang mga digital nga tighubad nga makaproseso sa mga hulagway ug mga video ug makahatag og tukma nga paghubad nga nagkonsiderar sa konteksto sa kultura ug sitwasyon.
    • Ang mga social media bot scanner nga makahimo sa usa ka mas holistic nga pag-analisar sa sentimento pinaagi sa paghiusa sa mga hulagway, mga caption, ug mga komento. Kini nga aplikasyon mahimong mapuslanon sa pag-moderate sa sulud nga nanginahanglan pag-analisar sa makadaot nga mga imahe.
    • Ang pagdugang sa mga oportunidad sa trabaho alang sa panan-aw sa kompyuter ug mga inhenyero sa pagkat-on sa makina sa NLP ug mga siyentipiko sa datos.
    • Ang mga startup nga nagtukod sa kini nga mga sistema sa AI aron i-komersyal sila o maghatag mga naandan nga solusyon alang sa mga negosyo.

    Mga pangutana nga ikomento

    • Unsa pa sa imong hunahuna ang pagbag-o sa vokenization kung giunsa naton makig-uban sa mga robot?
    • Sa unsang paagi ang vokenization makapausab sa atong pagnegosyo ug pakig-uban sa atong mga gadgets (smartphones ug smart appliances)?

    Mga pakisayran sa panabut

    Ang mosunod nga popular ug institusyonal nga mga sumpay gi-refer alang niini nga panabut: