Синтетички подаци: Креирање тачних АИ система коришћењем произведених модела

КРЕДИТ ЗА СЛИКУ:
Слика кредит
иСтоцк

Синтетички подаци: Креирање тачних АИ система коришћењем произведених модела

Синтетички подаци: Креирање тачних АИ система коришћењем произведених модела

Текст поднаслова
За креирање тачних модела вештачке интелигенције (АИ), симулирани подаци креирани алгоритмом постају све кориснији.
    • Аутор:
    • ime аутора
      Куантумрун Форесигхт
    • Може 4, 2022

    Сажетак увида

    Синтетички подаци, моћан алат који има апликације у распону од здравствене заштите до малопродаје, преобликује начин на који се АИ системи развијају и имплементирају. Омогућавајући стварање разноврсних и сложених скупова података без угрожавања осетљивих информација, синтетички подаци повећавају ефикасност у свим индустријама, чувајући приватност и смањујући трошкове. Међутим, он такође представља изазове, као што су потенцијална злоупотреба у стварању обмањујућих медија, забринутост за животну средину у вези са потрошњом енергије и промене у динамици тржишта рада којима треба пажљиво управљати.

    Контекст синтетичких података

    Деценијама су синтетички подаци постојали у различитим облицима. Може се наћи у компјутерским играма као што су симулатори летења и у симулацијама физике које приказују све, од атома до галаксија. Сада се синтетички подаци примењују у индустријама као што је здравство за решавање изазова вештачке интелигенције у стварном свету.

    Напредак АИ и даље наилази на неколико препрека имплементацији. Потребни су, на пример, велики скупови података да би се дали поуздани налази, били без пристрасности и придржавали се све строжијих прописа о приватности података. Усред ових изазова, анотирани подаци креирани компјутеризованим симулацијама или програмима су се појавили као алтернатива правим подацима. Ови подаци креирани од вештачке интелигенције, познати као синтетички подаци, кључни су за решавање проблема приватности и искорењивање предрасуда јер могу да осигурају разноликост података која одражава стварни свет.

    Здравствени радници користе синтетичке податке, као пример, у сектору медицинских слика како би обучили системе вештачке интелигенције, истовремено одржавајући поверљивост пацијената. Фирма за виртуелну негу, Цураи, на пример, користила је 400,000 синтетичких медицинских случајева да обучи алгоритам за дијагнозу. Штавише, продавци као што је Цапер користе 3Д симулације да креирају синтетички скуп података од хиљаду фотографија од само пет снимака производа. Према Гартнер студији објављеној у јуну 2021. која се фокусира на синтетичке податке, већина података који се користе у развоју вештачке интелигенције биће вештачки произведена законодавством, статистичким стандардима, симулацијама или другим средствима до 2030. године.

    Ометајући утицај

    Синтетички подаци помажу у очувању приватности и спречавању кршења података. На пример, болница или корпорација може да понуди програмеру висококвалитетне синтетичке медицинске податке за обуку система дијагнозе рака заснованог на вештачкој интелигенцији—подаци који су сложени колико и подаци из стварног света које овај систем треба да тумачи. На овај начин, програмери имају квалитетне скупове података које користе приликом пројектовања и компајлирања система, а болничка мрежа не ризикује да угрози осетљиве медицинске податке пацијената. 

    Синтетички подаци могу даље омогућити купцима података за тестирање да приступе информацијама по нижој цени од традиционалних услуга. Према Паулу Валборском, који је суоснивач АИ Реверие, једног од првих посвећених синтетичких предузећа за податке, једна слика која кошта 6 долара од услуге означавања може се вештачки генерисати за шест центи. Супротно томе, синтетички подаци ће утрти пут за проширене податке, што подразумева додавање нових података постојећем скупу података из стварног света. Програмери би могли да ротирају или осветле стару слику да би направили нову. 

    На крају, имајући у виду забринутост за приватност и владина ограничења, лични подаци који постоје у бази података постају све више законски регулисани и сложенији, што отежава коришћење информација из стварног света за креирање нових програма и платформи. Синтетички подаци би могли да обезбеде програмерима решење за заобилазно решење за замену веома осетљивих података.

    Импликације синтетичких података 

    Шире импликације синтетичких података могу укључивати:

    • Убрзани развој нових система вештачке интелигенције, како по обиму тако и по разноврсности, који побољшавају процесе у бројним индустријама и областима дисциплине, што доводи до побољшане ефикасности у секторима као што су здравство, транспорт и финансије.
    • Омогућавање организацијама да отвореније деле информације и тимовима да сарађују и раде ефикасније, што доводи до кохезивнијег радног окружења и способности да се са лакоћом баве сложеним пројектима.
    • Програмери и професионалци за податке који су у могућности да шаљу е-пошту или носе велике синтетичке скупове података на својим лаптоповима, сигурни да знају да критични подаци нису угрожени, што доводи до флексибилнијих и сигурнијих радних услова.
    • Смањена учесталост нарушавања сајбер-безбедности базе података, пошто аутентичним подацима више неће бити потребно приступити или делити тако често, што ће довести до сигурнијег дигиталног окружења за предузећа и појединце.
    • Владе добијају више слободе да спроводе строжије законе о управљању подацима без бриге о томе да ће ометати индустријски развој система вештачке интелигенције, што ће довести до уређеније и транспарентније употребе података.
    • Потенцијал да се синтетички подаци неетички користе у креирању деепфакеса или других манипулативних медија, што доводи до дезинформација и ерозије поверења у дигитални садржај.
    • Промена у динамици тржишта рада, са повећаним ослањањем на синтетичке податке, потенцијално смањује потребу за улогама прикупљања података, што доводи до измештања послова у одређеним секторима.
    • Потенцијални утицај на животну средину повећаних рачунарских ресурса потребних за генерисање и управљање синтетичким подацима, што доводи до веће потрошње енергије и повезаних еколошких проблема.

    Питања која треба размотрити

    • Које друге индустрије могу имати користи од синтетичких података?
    • Које прописе би влада требало да примени у вези са начином на који се синтетички подаци креирају, користе и примењују? 

    Референце за увид

    Следеће популарне и институционалне везе су референциране за овај увид: