Sünteetilised andmed: täpsete AI-süsteemide loomine valmistatud mudelite abil

PILDIKrediit:
Pildikrediit
iStock

Sünteetilised andmed: täpsete AI-süsteemide loomine valmistatud mudelite abil

Sünteetilised andmed: täpsete AI-süsteemide loomine valmistatud mudelite abil

Alapealkirja tekst
Täpsete tehisintellekti (AI) mudelite loomiseks on algoritmi loodud simuleeritud andmed üha kasulikumad.
    • Autor:
    • autori nimi
      Quantumrun Foresight
    • Võib 4 2022

    Ülevaate kokkuvõte

    Sünteetilised andmed, võimas tööriist, mille rakendusi ulatuvad tervishoiust jaemüügini, kujundavad ümber AI-süsteemide arendamise ja juurutamise viisi. Võimaldades luua erinevaid ja keerulisi andmekogumeid tundlikku teavet ohustamata, suurendavad sünteetilised andmed kõigi tööstusharude tõhusust, säilitavad privaatsust ja vähendavad kulusid. Siiski toob see kaasa ka väljakutseid, nagu võimalik väärkasutus petliku meedia loomisel, energiatarbimisega seotud keskkonnaprobleemid ja nihked tööturu dünaamikas, mida tuleb hoolikalt juhtida.

    Sünteetiline andmekontekst

    Aastakümneid on sünteetilised andmed eksisteerinud erineval kujul. Seda võib leida arvutimängudest nagu lennusimulaatorid ja füüsikasimulatsioonid, mis kujutavad kõike alates aatomitest kuni galaktikateni. Nüüd kasutatakse sünteetilisi andmeid sellistes tööstusharudes nagu tervishoid, et lahendada reaalseid tehisintellekti probleeme.

    Tehisintellekti edenemine puutub jätkuvalt kokku mitmete rakendamisega seotud takistustega. Usaldusväärsete leidude edastamiseks, erapoolikusteta ja üha rangemate andmekaitseeeskirjade järgimiseks on vaja näiteks suuri andmekogumeid. Nende väljakutsete keskel on tõeliste andmete alternatiivina esile kerkinud arvutisimulatsioonide või programmide abil loodud annoteeritud andmed. Need tehisintellektiga loodud andmed, mida tuntakse sünteetiliste andmetena, on privaatsusprobleemide lahendamisel ja eelarvamuste kaotamisel üliolulised, kuna need võivad tagada tegelikku maailma kajastava andmete mitmekesisuse.

    Tervishoiutöötajad kasutavad meditsiiniliste kujutiste sektoris näiteks sünteetilisi andmeid, et koolitada tehisintellektisüsteeme, säilitades samal ajal patsiendi konfidentsiaalsuse. Näiteks virtuaalhooldusfirma Curai kasutas diagnoosialgoritmi koolitamiseks 400,000 3 sünteetilist meditsiinijuhtumit. Lisaks kasutavad jaemüüjad, nagu Caper, 2021D-simulatsioone, et luua tuhandest fotost koosnev sünteetiline andmekogu kõigest viiest tootepildist. Vastavalt Gartneri 2030. aasta juunis avaldatud sünteetilistele andmetele keskendunud uuringule toodetakse XNUMX. aastaks enamik tehisintellekti arendamiseks kasutatavatest andmetest kunstlikult seadusandluse, statistiliste standardite, simulatsioonide või muude vahenditega.

    Häiriv mõju

    Sünteetilised andmed aitavad säilitada privaatsust ja ennetada andmetega seotud rikkumisi. Näiteks võib haigla või ettevõte pakkuda arendajale kvaliteetseid sünteetilisi meditsiinilisi andmeid, et koolitada tehisintellektil põhinevat vähidiagnostika süsteemi – andmeid, mis on sama keerulised kui tegelikud andmed, mida see süsteem on mõeldud tõlgendama. Nii on arendajatel süsteemi kavandamisel ja koostamisel kasutada kvaliteetsed andmestikud ning haiglavõrk ei riski delikaatsete patsientide meditsiiniliste andmete ohtu seada. 

    Sünteetilised andmed võimaldavad testimisandmete ostjatel juurdepääsu teabele traditsioonilistest teenustest madalama hinnaga. Ühe esimese sünteetiliste andmetega tegeleva ettevõtte AI Reverie kaasasutaja Paul Walborsky sõnul saab ühe pildi, mis maksab märgistamisteenusest 6 dollarit, kunstlikult luua kuue sendi eest. Seevastu sünteetilised andmed sillutavad teed laiendatud andmetele, mis tähendab uute andmete lisamist olemasolevasse reaalmaailma andmekogumisse. Arendajad võivad uue pildi tegemiseks vana pilti pöörata või heledamaks muuta. 

    Lõpuks, arvestades privaatsusprobleeme ja valitsuse piiranguid, muutub andmebaasis olev isiklik teave üha enam seadusandlikuks ja keerukamaks, mistõttu on reaalse maailma teabe kasutamine uute programmide ja platvormide loomiseks raskem. Sünteetilised andmed võivad pakkuda arendajatele lahenduse ülitundlike andmete asendamiseks.

    Sünteetiliste andmete tagajärjed 

    Sünteetiliste andmete laiemad tagajärjed võivad hõlmata järgmist:

    • Uute tehisintellektisüsteemide kiirendatud väljatöötamine nii mastaabis kui ka mitmekesisuses, mis parandavad protsesse paljudes tööstusharudes ja distsipliinivaldkondades, mis toob kaasa suurema tõhususe sellistes sektorites nagu tervishoid, transport ja rahandus.
    • Võimaldab organisatsioonidel teavet avatumalt jagada ja meeskondadel tõhusamalt koostööd teha ja tegutseda, mis toob kaasa ühtsema töökeskkonna ja võimaluse keeruliste projektidega hõlpsalt hakkama saada.
    • Arendajad ja andmespetsialistid saavad oma sülearvutites e-kirju saata või suuri sünteetilisi andmekogumeid kaasas kanda, teades, et kriitilised andmed ei ole ohus, mis toob kaasa paindlikumad ja turvalisemad töötingimused.
    • Andmebaasi küberturvalisuse rikkumiste sagedus väheneb, kuna autentsetele andmetele ei pea enam nii sageli juurde pääsema ega neid jagama, mis toob kaasa turvalisema digitaalse keskkonna nii ettevõtetele kui ka üksikisikutele.
    • Valitsused saavad rohkem vabadust rakendada rangemaid andmehaldusalaseid õigusakte, muretsemata tehisintellektisüsteemide tööstuse arengu takistamise pärast, mis toob kaasa rohkem reguleeritud ja läbipaistvama andmekasutusmaastiku.
    • Sünteetiliste andmete ebaeetiline kasutamine sünteetiliste võltsingute või muude manipuleerivate meediumide loomisel, mis toob kaasa valeinformatsiooni ja usalduse vähenemise digitaalse sisu vastu.
    • Muutused tööturu dünaamikas koos sünteetiliste andmete suurema sõltuvusega võib potentsiaalselt vähendada vajadust andmete kogumise rollide järele, mis toob kaasa töökohtade ümberpaigutamise teatud sektorites.
    • Sünteetiliste andmete genereerimiseks ja haldamiseks vajalike arvutusressursside suurenemise potentsiaalne keskkonnamõju, mis põhjustab suuremat energiatarbimist ja sellega seotud keskkonnaprobleeme.

    Küsimused, mida kaaluda

    • Millised teised tööstusharud võiksid sünteetilistest andmetest kasu saada?
    • Milliseid eeskirju peaks valitsus rakendama sünteetiliste andmete loomise, kasutamise ja juurutamise kohta? 

    Insight viited

    Selle ülevaate jaoks viidati järgmistele populaarsetele ja institutsionaalsetele linkidele: