Синтетикалық деректер: өндірілген үлгілерді пайдаланып дәл AI жүйелерін жасау

Кредит суреті:
Сурет несиесі
iStock

Синтетикалық деректер: өндірілген үлгілерді пайдаланып дәл AI жүйелерін жасау

Синтетикалық деректер: өндірілген үлгілерді пайдаланып дәл AI жүйелерін жасау

Тақырып мәтіні
Дәл жасанды интеллект (AI) үлгілерін жасау үшін алгоритм арқылы жасалған модельденген деректердің пайдалылығы артады.
    • автор:
    • Автордың аты-жөні
      Кванттық болжау
    • Мамыр 4, 2022

    Түсінікті қорытынды

    Синтетикалық деректер, денсаулық сақтаудан бастап бөлшек саудаға дейінгі қосымшалары бар қуатты құрал AI жүйелерін әзірлеу және енгізу жолын қайта қалыптастырады. Жасанды деректер құпия ақпаратқа қауіп төндірмей, әртүрлі және күрделі деректер жиынын жасауға мүмкіндік бере отырып, салалардағы тиімділікті арттырады, құпиялылықты сақтайды және шығындарды азайтады. Дегенмен, ол сонымен қатар алдамшы ақпарат құралдарын жасауда ықтимал теріс пайдалану, энергияны тұтынуға байланысты экологиялық мәселелер және мұқият басқаруды қажет ететін еңбек нарығының динамикасындағы өзгерістер сияқты қиындықтарды тудырады.

    Синтетикалық деректер контексі

    Ондаған жылдар бойы синтетикалық деректер әртүрлі формада болды. Оны ұшу тренажерлары сияқты компьютерлік ойындарда және атомдардан бастап галактикаларға дейін бейнелейтін физика модельдеулерінен табуға болады. Қазір синтетикалық деректер денсаулық сақтау сияқты салаларда нақты әлемдегі AI мәселелерін шешу үшін қолданылады.

    Жасанды интеллекттің дамуы бірнеше іске асыру кедергілеріне тап болуда. Үлкен деректер жинақтары, мысалы, сенімді қорытындыларды жеткізу, біржақтылықтан аулақ болу және деректердің құпиялылығының барған сайын қатаң ережелерін сақтау үшін қажет. Осы қиындықтардың аясында компьютерлендірілген модельдеу немесе бағдарламалар арқылы жасалған аннотацияланған деректер шынайы деректерге балама ретінде пайда болды. Синтетикалық деректер деп аталатын бұл AI жасаған деректер құпиялылық мәселелерін шешу және теріс пікірді жою үшін өте маңызды, өйткені ол нақты әлемді көрсететін деректер әртүрлілігін қамтамасыз ете алады.

    Медициналық дәрігерлер пациенттердің құпиялығын сақтай отырып, AI жүйелерін оқыту үшін медициналық кескіндер секторында мысал ретінде синтетикалық деректерді пайдаланады. Мысалы, Curai виртуалды күтім фирмасы диагностика алгоритмін үйрету үшін 400,000 3 синтетикалық медициналық жағдайды пайдаланды. Сонымен қатар, Caper сияқты бөлшек саудагерлер 2021D модельдеуін қолданады, олар бес өнім түсірілімінен мың фотосуреттің синтетикалық деректер жинағын жасайды. 2030 жылдың маусым айында шығарылған Gartner зерттеуіне сәйкес синтетикалық деректерге бағытталған, AI әзірлеуде пайдаланылатын деректердің көпшілігі XNUMX жылға қарай заңнама, статистикалық стандарттар, модельдеу немесе басқа құралдар арқылы жасанды түрде жасалады.

    Деструктивті әсер

    Синтетикалық деректер құпиялылықты сақтауға және деректердің бұзылуының алдын алуға көмектеседі. Мысалы, аурухана немесе корпорация AI негізіндегі қатерлі ісік диагностикасы жүйесін үйрету үшін әзірлеушіге жоғары сапалы синтетикалық медициналық деректерді ұсына алады - бұл жүйе түсіндіруге арналған нақты әлемдегі деректер сияқты күрделі деректер. Осылайша, әзірлеушілер жүйені жобалау және құрастыру кезінде пайдалану үшін сапалы деректер жиынына ие болады және аурухана желісі сезімтал, пациенттің медициналық деректеріне қауіп төндірмейді. 

    Синтетикалық деректер тестілеу деректерін сатып алушыларға дәстүрлі қызметтерге қарағанда төмен бағамен ақпаратқа қол жеткізуге мүмкіндік береді. Алғашқы синтетикалық деректер бизнесінің бірі AI Reverie негізін қалаушы Пол Уолборскийдің айтуынша, таңбалау қызметінен 6 доллар тұратын бір суретті алты центке жасанды түрде жасауға болады. Керісінше, синтетикалық деректер кеңейтілген деректерге жол ашады, бұл бұрыннан бар нақты деректер жинағына жаңа деректерді қосуды талап етеді. Әзірлеушілер жаңасын жасау үшін ескі кескінді айналдыра немесе жарқырата алады. 

    Ақырында, құпиялылыққа қатысты мәселелер мен үкімет шектеулерін ескере отырып, дерекқордағы жеке ақпарат барған сайын заңдастырылған және күрделі болып келеді, бұл жаңа бағдарламалар мен платформаларды жасау үшін нақты әлемдегі ақпаратты пайдалануды қиындатады. Синтетикалық деректер әзірлеушілерге аса сезімтал деректерді ауыстыру үшін уақытша шешім бере алады.

    Синтетикалық мәліметтердің салдары 

    Синтетикалық деректердің кеңірек салдары мыналарды қамтуы мүмкін:

    • Денсаулық сақтау, көлік және қаржы сияқты салаларда тиімділікті арттыруға әкелетін көптеген салалар мен тәртіп салаларындағы процестерді жақсартатын ауқымды және әртүрлілік бойынша жаңа AI жүйелерінің жедел дамуы.
    • Ұйымдарға ақпаратты ашық түрде бөлісуге және топтарға бірлесіп жұмыс істеуге және тиімдірек жұмыс істеуге мүмкіндік беру, бұл ұйымшыл жұмыс ортасына және күрделі жобаларды оңай шешуге мүмкіндік береді.
    • Әзірлеушілер мен деректер мамандары үлкен синтетикалық деректер жиынын электрондық пошта арқылы жібере алады немесе ноутбуктерінде алып жүре алады, бұл маңызды деректерге қауіп төндірмейтінін білу арқылы қауіпсіз және икемді және қауіпсіз жұмыс жағдайларына әкеледі.
    • Дерекқордың киберқауіпсіздігін бұзу жиілігінің азаюы, өйткені шынайы деректерге бұдан былай жиі қол жеткізу немесе ортақ пайдалану қажет болмайды, бұл бизнес пен жеке тұлғалар үшін қауіпсіз цифрлық ортаға әкеледі.
    • Үкімет AI жүйелерінің салалық дамуына кедергі келтірмей, деректерді басқарудың неғұрлым қатаң заңнамасын енгізуге көбірек еркіндік алады, бұл деректерді пайдаланудың реттелетін және мөлдір көрінісіне әкеледі.
    • Синтетикалық деректердің терең фейктерді немесе басқа манипуляциялық ақпарат құралдарын жасауда әдепсіз пайдаланылуы мүмкін, бұл жалған ақпаратқа және цифрлық мазмұнға деген сенімнің жойылуына әкеледі.
    • Синтетикалық деректерге көбірек тәуелділікпен еңбек нарығы динамикасының ауысуы деректерді жинау рөлдерінің қажеттілігін азайтады, бұл белгілі бір секторларда жұмыс орындарын ауыстыруға әкеледі.
    • Синтетикалық деректерді құру және басқару үшін қажет ұлғайған есептеу ресурстарының қоршаған ортаға ықтимал әсері, бұл энергияны жоғары тұтынуға және онымен байланысты қоршаған ортаға қатысты мәселелерге әкеледі.

    Қарастырылатын сұрақтар

    • Синтетикалық деректерден басқа қандай салалар пайда көре алады?
    • Үкімет синтетикалық деректердің қалай жасалатынына, пайдаланылатынына және орналастырылуына қатысты қандай ережелерді енгізуі керек? 

    Инсайт сілтемелері

    Бұл түсінік үшін келесі танымал және институционалдық сілтемелерге сілтеме жасалды: