Syntetické údaje: Vytváranie presných systémov AI pomocou vyrobených modelov

OBRÁZOK PRE OBRÁZOK:
Obrazový kredit
iStock

Syntetické údaje: Vytváranie presných systémov AI pomocou vyrobených modelov

Syntetické údaje: Vytváranie presných systémov AI pomocou vyrobených modelov

Text podnadpisu
Na vytvorenie presných modelov umelej inteligencie (AI) sa zvyšuje užitočnosť simulovaných údajov vytvorených algoritmom.
    • Autor:
    • meno autora
      Predvídavosť Quantumrun
    • Môže 4, 2022

    Súhrn prehľadu

    Syntetické údaje, výkonný nástroj, ktorý má aplikácie od zdravotníctva po maloobchod, mení spôsob, akým sa vyvíjajú a implementujú systémy AI. Umožnením vytvárania rôznorodých a zložitých súborov údajov bez ohrozenia citlivých informácií zvyšujú syntetické údaje efektivitu v rôznych odvetviach, chránia súkromie a znižujú náklady. Predstavuje však aj výzvy, ako je potenciálne zneužitie pri vytváraní klamlivých médií, environmentálne obavy súvisiace so spotrebou energie a posuny v dynamike trhu práce, ktoré je potrebné starostlivo riadiť.

    Kontext syntetických údajov

    Už desaťročia existujú syntetické údaje v rôznych formách. Možno ho nájsť v počítačových hrách, ako sú letecké simulátory a vo fyzikálnych simuláciách, ktoré zobrazujú všetko od atómov po galaxie. Teraz sa syntetické údaje aplikujú v odvetviach, ako je zdravotníctvo, na riešenie skutočných výziev AI.

    Pokrok AI naďalej naráža na niekoľko implementačných prekážok. Od veľkých súborov údajov sa napríklad vyžaduje, aby poskytovali dôveryhodné zistenia, boli nezaujaté a dodržiavali čoraz prísnejšie nariadenia o ochrane osobných údajov. Uprostred týchto výziev sa ako alternatíva k skutočným údajom objavili anotované údaje vytvorené počítačovými simuláciami alebo programami. Tieto údaje vytvorené AI, známe ako syntetické údaje, sú rozhodujúce pre vyriešenie obáv o súkromie a odstránenie predsudkov, pretože môžu zabezpečiť rozmanitosť údajov, ktorá odráža skutočný svet.

    Zdravotnícki pracovníci používajú syntetické údaje ako príklad v sektore lekárskych snímok na školenie systémov AI pri zachovaní dôvernosti pacienta. Spoločnosť pre virtuálnu starostlivosť Curai napríklad použila 400,000 3 syntetických lekárskych prípadov na trénovanie diagnostického algoritmu. Okrem toho maloobchodníci, ako napríklad Caper, používajú 2021D simulácie na vytvorenie syntetického súboru údajov s tisíckami fotografií len z piatich záberov produktov. Podľa štúdie Gartner vydanej v júni 2030 zameranej na syntetické údaje, väčšina údajov využívaných pri vývoji AI bude do roku XNUMX umelo vyrobená legislatívou, štatistickými štandardmi, simuláciami alebo inými prostriedkami.

    Rušivý vplyv

    Syntetické údaje pomáhajú chrániť súkromie a predchádzať narušeniu údajov. Napríklad nemocnica alebo korporácia môže vývojárovi ponúknuť vysokokvalitné syntetické medicínske údaje na trénovanie systému diagnostiky rakoviny založeného na AI – údaje, ktoré sú také zložité ako údaje z reálneho sveta, ktoré má tento systém interpretovať. Vývojári tak majú k dispozícii kvalitné dátové sady, ktoré môžu použiť pri navrhovaní a zostavovaní systému a nemocničnej sieti nehrozí riziko ohrozenia citlivých zdravotných údajov pacientov. 

    Syntetické údaje môžu ďalej umožniť kupujúcim testovacích údajov prístup k informáciám za nižšiu cenu ako tradičné služby. Podľa Paula Walborského, ktorý spoluzakladal AI Reverie, jeden z prvých špecializovaných podnikov so syntetickými dátami, jeden obrázok, ktorý stojí 6 dolárov zo služby označovania, sa dá umelo vygenerovať za šesť centov. Naopak, syntetické údaje pripravia cestu pre rozšírené údaje, čo znamená pridanie nových údajov do existujúceho súboru údajov v reálnom svete. Vývojári mohli otočiť alebo rozjasniť starý obrázok a vytvoriť nový. 

    A napokon, vzhľadom na obavy o súkromie a vládne obmedzenia, osobné údaje existujúce v databáze sú čoraz viac legislatívne a komplexnejšie, čo sťažuje použitie skutočných informácií na vytváranie nových programov a platforiem. Syntetické údaje by mohli vývojárom poskytnúť riešenie na nahradenie vysoko citlivých údajov.

    Dôsledky syntetických údajov 

    Širšie dôsledky syntetických údajov môžu zahŕňať:

    • Zrýchlený vývoj nových systémov umelej inteligencie v rozsahu aj rozmanitosti, ktoré zlepšujú procesy v mnohých odvetviach a oblastiach disciplíny, čo vedie k vyššej efektívnosti v sektoroch, ako je zdravotníctvo, doprava a financie.
    • Umožnenie organizáciám otvorenejšie zdieľať informácie a tímom efektívnejšie spolupracovať a fungovať, čo vedie k súdržnejšiemu pracovnému prostrediu a schopnosti ľahko riešiť zložité projekty.
    • Vývojári a dátoví profesionáli môžu posielať e-maily alebo prenášať veľké súbory syntetických údajov na svojich prenosných počítačoch, pričom vedia, že kritické údaje nie sú ohrozené, čo vedie k flexibilnejším a bezpečnejším pracovným podmienkam.
    • Znížená frekvencia narušenia kybernetickej bezpečnosti databáz, keďže k autentickým údajom už nebude potrebné pristupovať alebo ich zdieľať tak často, čo povedie k bezpečnejšiemu digitálnemu prostrediu pre podniky aj jednotlivcov.
    • Vlády získavajú väčšiu slobodu pri implementácii prísnejšej legislatívy v oblasti správy údajov bez obáv z bránenia priemyselnému rozvoju systémov AI, čo vedie k regulovanejšiemu a transparentnejšiemu prostrediu využívania údajov.
    • Možnosť neetického využívania syntetických údajov pri vytváraní hlbokých falošných alebo iných manipulatívnych médií, čo vedie k dezinformáciám a narušeniu dôvery v digitálny obsah.
    • Posun v dynamike trhu práce so zvýšeným spoliehaním sa na syntetické údaje potenciálne znižuje potrebu úloh zberu údajov, čo vedie k presunu pracovných miest v určitých sektoroch.
    • Potenciálny environmentálny vplyv zvýšených výpočtových zdrojov potrebných na vytváranie a správu syntetických údajov, čo vedie k vyššej spotrebe energie a súvisiacim environmentálnym problémom.

    Otázky na zváženie

    • Ktoré ďalšie odvetvia by mohli mať prospech zo syntetických údajov?
    • Aké nariadenia by mala vláda implementovať, pokiaľ ide o to, ako sa vytvárajú, používajú a nasadzujú syntetické údaje? 

    Prehľadové referencie

    Pre tento prehľad boli použité nasledujúce populárne a inštitucionálne odkazy: