Синтетички податоци: Создавање точни системи за вештачка интелигенција со користење на произведени модели

КРЕДИТ НА СЛИКА:
Слика кредит
iStock

Синтетички податоци: Создавање точни системи за вештачка интелигенција со користење на произведени модели

Синтетички податоци: Создавање точни системи за вештачка интелигенција со користење на произведени модели

Текст за поднаслов
За да се создадат прецизни модели на вештачка интелигенција (ВИ), симулираните податоци создадени од алгоритам добиваат зголемена корисност.
    • автор:
    • име на авторот
      Quantumrun Foresight
    • Може 4, 2022

    Резиме на увид

    Синтетичките податоци, моќна алатка која има апликации кои се движат од здравствена заштита до малопродажба, го преобликуваат начинот на кој се развиваат и имплементираат системите за вештачка интелигенција. Со овозможување на создавање разновидни и сложени збирки на податоци без загрозување на чувствителните информации, синтетичките податоци ја подобруваат ефикасноста низ индустриите, ја зачувуваат приватноста и ги намалуваат трошоците. Сепак, тој исто така претставува предизвици, како што се потенцијална злоупотреба во создавањето измамнички медиуми, загриженоста за животната средина поврзана со потрошувачката на енергија и промените во динамиката на пазарот на трудот што треба внимателно да се управува.

    Контекс на синтетички податоци

    Со децении, синтетичките податоци постојат во различни форми. Може да се најде во компјутерски игри како што се симулатори за летање и во физичките симулации кои прикажуваат сè, од атоми до галаксии. Сега, синтетичките податоци се применуваат во индустриите како што е здравството за да се решат предизвиците со вештачката интелигенција во реалниот свет.

    Напредокот на вештачката интелигенција продолжува да наидува на неколку пречки за спроведување. Потребни се големи збирки податоци, на пример, за да се доставуваат доверливи наоди, да се ослободат од пристрасност и да се придржуваат до сè построгите прописи за приватност на податоците. Среде овие предизвици, забележани податоци создадени со компјутеризирани симулации или програми се појавија како алтернатива на вистинските податоци. Овие податоци создадени со вештачка интелигенција, познати како синтетички податоци, се од клучно значење за решавање на проблемите со приватноста и за искоренување на предрасудите бидејќи можат да обезбедат разновидност на податоците што го одразуваат вистинскиот свет.

    Здравствените работници користат синтетички податоци, како пример, во секторот за медицински слики за да ги обучуваат системите за вештачка интелигенција додека ја одржуваат доверливоста на пациентот. Фирмата за виртуелна нега, Кураи, на пример, користела 400,000 синтетички медицински случаи за да обучи алгоритам за дијагноза. Понатаму, трговците на мало како што е Капер користат 3D симулации за да создадат синтетичка база на податоци од илјада фотографии од само пет снимки од производи. Според студијата на Гартнер објавена во јуни 2021 година, фокусирана на синтетички податоци, повеќето од податоците користени во развојот на вештачката интелигенција ќе бидат вештачки произведени со законодавство, статистички стандарди, симулации или други средства до 2030 година.

    Нарушувачко влијание

    Синтетичките податоци помагаат во зачувување на приватноста и спречување на прекршување на податоците. На пример, болница или корпорација може да му понуди на развивачот висококвалитетни синтетички медицински податоци за да обучи систем за дијагностицирање на рак базиран на вештачка интелигенција - податоци што се сложени како и податоците од реалниот свет што овој систем треба да ги толкува. На овој начин, програмерите имаат квалитетни збирки на податоци што треба да ги користат при дизајнирање и составување на системот, а болничката мрежа не ризикува да ги загрози чувствителните медицински податоци за пациентите. 

    Синтетичките податоци може дополнително да им овозможат на купувачите на податоците за тестирање да пристапат до информации по пониска цена од традиционалните услуги. Според Пол Валборски, кој е ко-основач на AI Reverie, еден од првите посветени бизниси со синтетички податоци, една слика што чини 6 долари од услуга за етикетирање може вештачки да се генерира за шест центи. Спротивно на тоа, синтетичките податоци ќе го отворат патот за зголемени податоци, што подразбира додавање нови податоци во постоечката реална база на податоци. Програмерите може да ротираат или осветлуваат стара слика за да направат нова. 

    И на крај, со оглед на загриженоста за приватноста и владините ограничувања, личните информации кои постојат во базата на податоци стануваат сè позаконски и сложени, што го отежнува користењето на информациите од реалниот свет за создавање нови програми и платформи. Синтетичките податоци може да им обезбедат на програмерите решение за замена за да ги заменат многу чувствителните податоци.

    Импликации на синтетички податоци 

    Пошироките импликации на синтетичките податоци може да вклучуваат:

    • Забрзаниот развој на нови системи за вештачка интелигенција, и во обем и во разновидност, кои ги подобруваат процесите во бројни индустрии и полиња на дисциплина, што доведува до зголемена ефикасност во секторите како што се здравството, транспортот и финансиите.
    • Овозможување на организациите да споделуваат информации поотворено и тимовите да соработуваат и да работат поефикасно, што ќе доведе до покохезивна работна средина и способност за лесно справување со сложени проекти.
    • Програмерите и професионалците за податоци можат да испраќаат е-пошта или да носат големи синтетички сетови на податоци на нивните лаптопи, безбедни знаејќи дека критичните податоци не се загрозени, што доведува до пофлексибилни и побезбедни работни услови.
    • Намалената фреквенција на прекршувања на сајбер безбедноста на базата на податоци, бидејќи автентичните податоци повеќе нема да треба да се пристапуваат или да се споделуваат толку често, што доведува до посигурна дигитална средина за бизнисите и за поединците.
    • Владите добиваат поголема слобода да имплементираат построга легислатива за управување со податоци без да се грижат дека ќе го попречат развојот на индустрискиот развој на системи за вештачка интелигенција, што ќе доведе до порегулиран и транспарентен пејзаж за користење на податоци.
    • Потенцијалот синтетичките податоци да се користат неетички за создавање длабоки фејкови или други манипулативни медиуми, што доведува до дезинформации и ерозија на довербата во дигиталната содржина.
    • Промена на динамиката на пазарот на трудот, со зголемено потпирање на синтетички податоци потенцијално ја намалува потребата за улоги за собирање податоци, што ќе доведе до преместување на работните места во одредени сектори.
    • Потенцијалното влијание врз животната средина на зголемените пресметковни ресурси потребни за генерирање и управување со синтетички податоци, што доведува до поголема потрошувачка на енергија и поврзани еколошки проблеми.

    Прашања што треба да се разгледаат

    • Кои други индустрии би можеле да имаат корист од синтетичките податоци?
    • Кои регулативи треба да ги спроведе владата во врска со тоа како се создаваат, користат и распоредуваат синтетичките податоци? 

    Увид референци

    Следниве популарни и институционални врски беа упатени за овој увид: