Вокенизатсия: Забоне, ки AI метавонад онро бубинад

Кредити тасвирӣ:
Қарзи тасвирӣ
iStock

Вокенизатсия: Забоне, ки AI метавонад онро бубинад

Вокенизатсия: Забоне, ки AI метавонад онро бубинад

Матни зерсарлавҳа
Вақте ки тасвирҳо ҳоло ба омӯзиши системаҳои зеҳни сунъӣ (AI) дохил карда мешаванд, роботҳо метавонанд ба зудӣ метавонанд фармонҳоро "бинанд".
    • Муаллиф:
    • Номи муаллиф
      Пешгӯии Quantumrun
    • Мумкин аст 9, 2023

    Коркарди забони табиӣ (NLP) ба системаҳои зеҳни сунъӣ (AI) имкон дод, ки нутқи инсонро тавассути фаҳмидани калимаҳо ва мувофиқ кардани контекст бо эҳсосот омӯзанд. Ягона нуқсон дар он аст, ки ин системаҳои NLP сирф ба матн асос ёфтаанд. Вокенизатсия ҳама чизро тағир додан аст.

    Контексти вокенизатсия

    Ду барномаи омӯзиши мошинсозии матнӣ (ML) аксар вақт барои омӯзонидани AI барои коркард ва фаҳмидани забони инсон истифода мешаванд: OpenAI-и Generative Pre-trained Transformer 3 (GPT-3) ва BERT-и Google (Намояндагии рамзгузори дутарафа аз Transformers). Дар истилоҳоти AI, калимаҳое, ки дар омӯзиши NLP истифода мешаванд, токенҳо номида мешаванд. Муҳаққиқон аз Донишгоҳи Каролинаи Шимолӣ (UNC) мушоҳида карданд, ки барномаҳои таълимии бар матн асосёфта маҳдуданд, зеро онҳо наметавонанд "бинанд", яъне иттилооти визуалӣ ва муоширатро ба даст оварда наметавонанд. 

    Масалан, агар касе аз GPT-3 пурсад, ки ранги гӯсфанд чӣ гуна аст, система аксар вақт "сиёҳ" ҷавоб медиҳад, ҳатто агар он равшан сафед бошад. Ин посух аз он сабаб аст, ки системаи ба матн асосёфта ба ҷои муайян кардани ранги дуруст онро бо истилоҳи "гӯсфанди сиёҳ" алоқаманд мекунад. Бо ворид кардани визуалӣ бо нишонаҳо (воқеъ), системаҳои AI метавонанд фаҳмиши ҳамаҷонибаи истилоҳот дошта бошанд. Вокенизатсия вокенҳоро ба системаҳои худидоракунии NLP муттаҳид мекунад ва ба онҳо имкон медиҳад, ки "ақли солим" -ро инкишоф диҳанд.

    Интегратсияи моделҳои забонӣ ва биниши компютерӣ консепсияи нав нест ва он як соҳаи босуръат густаришёбандаи таҳқиқоти AI мебошад. Омезиши ин ду намуди AI аз қувватҳои инфиродии онҳо истифода мебарад. Моделҳои забонӣ ба монанди GPT-3 тавассути омӯзиши беназорат омӯзонида мешаванд, ки ба онҳо имкон медиҳад ба осонӣ миқёс кунанд. Баръакс, моделҳои тасвирӣ ба монанди системаҳои шинохти объект мустақиман аз воқеият омӯхта метавонанд ва ба абстраксияи матн такя намекунанд. Масалан, моделҳои тасвирӣ метавонанд бо дидани тасвир сафед будани гӯсфандро эътироф кунанд.

    Таъсири вайронкунанда

    Раванди вокенизатсия хеле осон аст. Вокенҳо тавассути таъин кардани тасвирҳои мувофиқ ё мувофиқ ба аломатҳои забон сохта мешаванд. Сипас, алгоритмҳо (вокенизатор) барои тавлиди вокенҳо тавассути омӯзиши беназорат тарҳрезӣ шудаанд (ҳеҷ параметрҳо/қоидаҳои возеҳ). AI-и солим, ки тавассути вокенизатсия омӯзонида шудааст, метавонад мушкилотро беҳтар муошират кунад ва ҳал кунад, зеро онҳо контекстро амиқтар фаҳманд. Ин равиш беназир аст, зеро он на танҳо аломатҳои забонро пешгӯӣ мекунад, балки аломатҳои тасвириро пешгӯӣ мекунад, ки он чизест, ки моделҳои анъанавии BERT наметавонанд иҷро кунанд.

    Масалан, ёрдамчиёни роботӣ метавонанд тасвирҳоро шинохта тавонанд ва равандҳоро беҳтар идора кунанд, зеро онҳо метавонанд "бинанд" он чизе, ки аз онҳо талаб карда мешавад. Системаҳои зеҳни сунъӣ, ки барои навиштани мундариҷа омӯзонида шудаанд, метавонанд ба ҷои ҷумлаҳои ҷудогона мақолаҳоеро эҷод кунанд, ки бештар ба инсон садо медиҳанд ва ғояҳое, ки беҳтар ҷорӣ мешаванд. Бо дарназардошти дастрасии васеи барномаҳои NLP, вокенизатсия метавонад ба чатботҳо, ёварони виртуалӣ, ташхиси тиббии онлайн, тарҷумонҳои рақамӣ ва ғайра оварда расонад.

    Илова бар ин, омезиши биниш ва омӯзиши забон дар барномаҳои тасвири тиббӣ, махсусан барои ташхиси автоматии тасвири тиббӣ, маъруфият пайдо мекунад. Масалан, баъзе муҳаққиқон ин равишро дар тасвирҳои рентгенӣ бо тавсифи матнии ҳамроҳ таҷриба мекунанд, ки дар он сегментатсияи семантикӣ метавонад вақтро сарф кунад. Технологияи вокенизатсия метавонад ин намояндагиҳоро такмил диҳад ва тасвири автоматии тиббиро тавассути истифодаи иттилооти матнӣ такмил диҳад.

    Аризаҳо барои овоздиҳӣ

    Баъзе барномаҳо барои овоздиҳӣ метавонанд инҳоро дар бар гиранд:

    • Чатботҳои интуитивӣ, ки метавонанд скриншотҳо, тасвирҳо ва мундариҷаи вебсайтро коркард кунанд. Махсусан чатботҳои дастгирии муштариён метавонанд маҳсулот ва хидматҳоро ба таври дақиқ тавсия диҳанд.
    • Тарҷумонҳои рақамӣ, ки метавонанд тасвирҳо ва видеоҳоро коркард кунанд ва тарҷумаи дақиқеро, ки контексти фарҳангӣ ва вазъиятро баррасӣ мекунанд, таъмин кунанд.
    • Сканнерҳои ботҳои ВАО иҷтимоӣ метавонанд тавассути якҷоя кардани тасвирҳо, сарлавҳаҳо ва шарҳҳо таҳлили ҳамаҷонибаи эҳсосот гузаронанд. Ин барнома метавонад дар модератсияи мундариҷа муфид бошад, ки таҳлили тасвирҳои зарароварро талаб мекунад.
    • Афзоиши имкониятҳои шуғл барои биниши компютерӣ ва муҳандисони омӯзиши мошинҳои NLP ва олимони маълумот.
    • Стартапҳо дар ин системаҳои AI сохта мешаванд, то онҳоро тиҷоратӣ кунанд ё барои тиҷорат қарорҳои фармоишӣ пешниҳод кунанд.

    Саволҳо барои шарҳ

    • Ба фикри шумо, вокенизатсия чӣ гуна муносибати мо бо роботҳоро тағир медиҳад?
    • Вокенизатсия чӣ гуна метавонад тарзи пешбурди тиҷорат ва муошират бо гаҷетҳои мо (смартфонҳо ва асбобҳои интеллектуалӣ)-ро тағир диҳад?

    Истинодҳои фаҳмиш

    Барои ин фаҳмиш истинодҳои зерини маъмул ва институтсионалӣ истинод карда шуданд: