Sintetični podatki: Ustvarjanje natančnih sistemov AI z uporabo izdelanih modelov

KREDIT ZA SLIKO:
Image kredit
iStock

Sintetični podatki: Ustvarjanje natančnih sistemov AI z uporabo izdelanih modelov

Sintetični podatki: Ustvarjanje natančnih sistemov AI z uporabo izdelanih modelov

Besedilo podnaslova
Za ustvarjanje natančnih modelov umetne inteligence (AI) se povečuje uporabnost simuliranih podatkov, ustvarjenih z algoritmom.
    • Avtor:
    • ime avtorja
      Quantumrun Foresight
    • Maj 4, 2022

    Povzetek vpogleda

    Sintetični podatki, zmogljivo orodje, ki se uporablja od zdravstva do maloprodaje, preoblikujejo način razvoja in implementacije sistemov AI. Z omogočanjem ustvarjanja raznolikih in zapletenih naborov podatkov brez ogrožanja občutljivih informacij sintetični podatki izboljšujejo učinkovitost v panogah, ohranjajo zasebnost in zmanjšujejo stroške. Vendar pa predstavlja tudi izzive, kot so morebitna zloraba pri ustvarjanju zavajajočih medijev, okoljska vprašanja, povezana s porabo energije, in premiki v dinamiki trga dela, ki jih je treba skrbno upravljati.

    Kontekst sintetičnih podatkov

    Sintetični podatki že desetletja obstajajo v različnih oblikah. Najdemo ga lahko v računalniških igrah, kot so simulatorji letenja, in v fizikalnih simulacijah, ki prikazujejo vse od atomov do galaksij. Zdaj se sintetični podatki uporabljajo v panogah, kot je zdravstvo, za reševanje resničnih izzivov umetne inteligence.

    Napredek umetne inteligence še naprej naleti na več ovir pri izvajanju. Veliki nabori podatkov so na primer potrebni za zagotavljanje zanesljivih ugotovitev, brez pristranskosti in upoštevanje vse strožjih predpisov o zasebnosti podatkov. Med temi izzivi so se kot alternativa pristnim podatkom pojavili označeni podatki, ustvarjeni z računalniškimi simulacijami ali programi. Ti podatki, ustvarjeni z umetno inteligenco, znani kot sintetični podatki, so ključnega pomena za reševanje pomislekov glede zasebnosti in izkoreninjenje predsodkov, saj lahko zagotovijo raznolikost podatkov, ki odražajo dejanski svet.

    Zdravstveni delavci uporabljajo sintetične podatke, na primer, v sektorju medicinskih slik za usposabljanje sistemov umetne inteligence, hkrati pa ohranjajo zaupnost bolnikov. Virtualno oskrbovalno podjetje Curai je na primer uporabilo 400,000 sintetičnih medicinskih primerov za usposabljanje diagnostičnega algoritma. Poleg tega trgovci na drobno, kot je Caper, uporabljajo 3D simulacije za ustvarjanje sintetičnega nabora podatkov s tisoč fotografijami iz samo petih posnetkov izdelka. Glede na Gartnerjevo študijo, objavljeno junija 2021, osredotočeno na sintetične podatke, bo večina podatkov, uporabljenih pri razvoju umetne inteligence, do leta 2030 umetno proizvedena z zakonodajo, statističnimi standardi, simulacijami ali drugimi sredstvi.

    Moteč vpliv

    Sintetični podatki pomagajo pri ohranjanju zasebnosti in preprečevanju kršitev podatkov. Na primer, bolnišnica ali korporacija lahko razvijalcu ponudi visokokakovostne sintetične medicinske podatke za usposabljanje sistema za diagnosticiranje raka, ki temelji na umetni inteligenci – podatke, ki so tako zapleteni kot podatki iz resničnega sveta, ki naj bi jih ta sistem interpretiral. Na ta način imajo razvijalci na voljo kakovostne nabore podatkov, ki jih lahko uporabijo pri načrtovanju in sestavljanju sistema, bolnišnično omrežje pa ne tvega, da bi ogrozilo občutljive zdravstvene podatke bolnikov. 

    Sintetični podatki lahko dodatno omogočijo kupcem testnih podatkov dostop do informacij po nižji ceni kot tradicionalne storitve. Po besedah ​​Paula Walborskyja, ki je soustanovil AI Reverie, eno prvih namenskih podjetij s sintetičnimi podatki, je mogoče eno samo sliko, ki stane 6 USD pri storitvi označevanja, umetno ustvariti za šest centov. Nasprotno pa bodo sintetični podatki utrli pot razširjenim podatkom, kar pomeni dodajanje novih podatkov obstoječemu naboru podatkov iz resničnega sveta. Razvijalci bi lahko zavrteli ali posvetlili staro sliko, da bi ustvarili novo. 

    Nazadnje, glede na pomisleke glede zasebnosti in vladne omejitve osebni podatki, ki obstajajo v zbirki podatkov, postajajo vse bolj zakonsko predpisani in zapleteni, zaradi česar je težje uporabiti informacije iz resničnega sveta za ustvarjanje novih programov in platform. Sintetični podatki bi lahko razvijalcem ponudili rešitev za zamenjavo zelo občutljivih podatkov.

    Posledice sintetičnih podatkov 

    Širše posledice sintetičnih podatkov lahko vključujejo:

    • Pospešen razvoj novih sistemov umetne inteligence, tako v obsegu kot v raznolikosti, ki izboljšujejo procese v številnih panogah in področjih discipline, kar vodi do povečane učinkovitosti v sektorjih, kot so zdravstvo, transport in finance.
    • Omogočanje organizacijam, da bolj odprto delijo informacije, in skupinam, da sodelujejo in delujejo bolj učinkovito, kar vodi do bolj kohezivnega delovnega okolja in zmožnosti, da se z lahkoto lotijo ​​kompleksnih projektov.
    • Razvijalci in strokovnjaki za podatke lahko pošiljajo po e-pošti ali prenašajo velike sintetične nabore podatkov na svojih prenosnikih, pri čemer vedo, da kritični podatki niso ogroženi, kar vodi do bolj prilagodljivih in varnejših delovnih pogojev.
    • Zmanjšana pogostost kršitev kibernetske varnosti baz podatkov, saj do avtentičnih podatkov ne bo več treba tako pogosto dostopati ali jih deliti, kar bo vodilo v bolj varno digitalno okolje za podjetja in posameznike.
    • Vlade pridobijo več svobode pri izvajanju strožje zakonodaje o upravljanju podatkov, ne da bi jih skrbelo oviranje industrijskega razvoja sistemov umetne inteligence, kar vodi v bolj regulirano in pregledno okolje uporabe podatkov.
    • Možnost neetične uporabe sintetičnih podatkov pri ustvarjanju globokih ponaredkov ali drugih manipulativnih medijev, kar vodi v napačne informacije in erozijo zaupanja v digitalno vsebino.
    • Sprememba v dinamiki trga dela z večjo odvisnostjo od sintetičnih podatkov lahko zmanjša potrebo po vlogah zbiranja podatkov, kar vodi do izpodrivanja delovnih mest v nekaterih sektorjih.
    • Potencialni okoljski vpliv povečanih računalniških virov, potrebnih za ustvarjanje in upravljanje sintetičnih podatkov, kar vodi do večje porabe energije in s tem povezanih skrbi za okolje.

    Vprašanja, ki jih je treba upoštevati

    • Katere druge industrije bi lahko imele koristi od sintetičnih podatkov?
    • Katere predpise bi morala vlada izvajati glede tega, kako se sintetični podatki ustvarjajo, uporabljajo in nameščajo? 

    Insight reference

    Za ta vpogled so bile navedene naslednje priljubljene in institucionalne povezave: