Sintetiniai duomenys: tikslių AI sistemų kūrimas naudojant pagamintus modelius

VAIZDO KREDITAS:
Paveikslėlio kredito
iStock

Sintetiniai duomenys: tikslių AI sistemų kūrimas naudojant pagamintus modelius

Sintetiniai duomenys: tikslių AI sistemų kūrimas naudojant pagamintus modelius

Paantraštės tekstas
Norint sukurti tikslius dirbtinio intelekto (AI) modelius, algoritmo sukurti modeliuoti duomenys tampa vis naudingesni.
    • Autorius:
    • autoriaus vardas
      Quantumrun Foresight
    • Gali 4, 2022

    Įžvalgos santrauka

    Sintetiniai duomenys – galingas įrankis, kuriame yra įvairių programų – nuo ​​sveikatos priežiūros iki mažmeninės prekybos – keičia AI sistemų kūrimo ir diegimo būdą. Suteikdami galimybę kurti įvairius ir sudėtingus duomenų rinkinius nesukeliant pavojaus jautriai informacijai, sintetiniai duomenys didina veiksmingumą visose pramonės šakose, išsaugo privatumą ir mažina išlaidas. Tačiau tai taip pat kelia iššūkių, tokių kaip galimas piktnaudžiavimas kuriant apgaulingą žiniasklaidą, aplinkosaugos problemos, susijusios su energijos vartojimu, ir darbo rinkos dinamikos pokyčiai, kuriuos reikia atidžiai valdyti.

    Sintetinių duomenų kontekstas

    Dešimtmečius sintetiniai duomenys egzistavo įvairiomis formomis. Jį galima rasti kompiuteriniuose žaidimuose, tokiuose kaip skrydžio treniruokliai, ir fizikos modeliavimuose, kuriuose vaizduojama viskas – nuo ​​atomų iki galaktikų. Dabar sintetiniai duomenys naudojami tokiose pramonės šakose kaip sveikatos priežiūra, siekiant išspręsti realaus pasaulio AI iššūkius.

    AI tobulėjimas ir toliau susiduria su keliomis įgyvendinimo kliūtimis. Pavyzdžiui, reikalingi dideli duomenų rinkiniai, kad būtų pateiktos patikimos išvados, nebūtų šališkumo ir būtų laikomasi vis griežtesnių duomenų privatumo taisyklių. Atsižvelgiant į šiuos iššūkius, anotuoti duomenys, sukurti naudojant kompiuterizuotą modeliavimą ar programas, pasirodė kaip alternatyva tikriems duomenims. Šie dirbtinio intelekto sukurti duomenys, žinomi kaip sintetiniai duomenys, yra labai svarbūs sprendžiant privatumo problemas ir panaikinant išankstinį nusistatymą, nes jie gali užtikrinti duomenų įvairovę, kuri atspindi tikrąjį pasaulį.

    Sveikatos priežiūros specialistai naudoja sintetinius duomenis, pavyzdžiui, medicininių vaizdų sektoriuje, kad mokytų dirbtinio intelekto sistemas, išlaikydami pacientų konfidencialumą. Pavyzdžiui, virtualios priežiūros įmonė Curai naudojo 400,000 3 sintetinių medicininių atvejų, kad išmokytų diagnozės algoritmą. Be to, mažmenininkai, tokie kaip „Caper“, naudoja 2021D modeliavimą, kad sukurtų tūkstančio nuotraukų sintetinį duomenų rinkinį iš vos penkių gaminių kadrų. Remiantis 2030 m. birželio mėn. paskelbtu „Gartner“ tyrimu, kuriame pagrindinis dėmesys buvo skiriamas sintetiniams duomenims, iki XNUMX m. didžioji dalis dirbtinio intelekto kūrimui naudojamų duomenų bus dirbtinai sukurta teisės aktais, statistiniais standartais, modeliavimu ar kitomis priemonėmis.

    Trikdantis poveikis

    Sintetiniai duomenys padeda išsaugoti privatumą ir užkirsti kelią duomenų pažeidimams. Pavyzdžiui, ligoninė ar korporacija kūrėjui gali pasiūlyti aukštos kokybės sintetinius medicininius duomenis, skirtus dirbtinio intelekto pagrindu veikiančiai vėžio diagnostikos sistemai parengti – duomenis, kurie yra tokie pat sudėtingi, kaip ir realaus pasaulio duomenys, kuriuos ši sistema turi interpretuoti. Tokiu būdu kūrėjai turi kokybiškus duomenų rinkinius, kuriuos gali naudoti kurdami ir kompiliuodami sistemą, o ligoninių tinklas nekelia pavojaus jautriems, pacientų medicininiams duomenims. 

    Sintetiniai duomenys gali leisti testavimo duomenų pirkėjams gauti informaciją už mažesnę kainą nei tradicinės paslaugos. Pasak Paulo Walborsky, įkūrusio AI Reverie – vieną pirmųjų tam skirtų sintetinių duomenų verslų, vieną vaizdą, kainuojantį 6 dolerius iš ženklinimo paslaugos, galima dirbtinai sugeneruoti už šešis centus. Ir atvirkščiai, sintetiniai duomenys atvers kelią papildytiems duomenims, o tai reiškia, kad į esamą realaus pasaulio duomenų rinkinį reikia įtraukti naujų duomenų. Kūrėjai gali pasukti arba pašviesinti seną vaizdą, kad sukurtų naują. 

    Galiausiai, atsižvelgiant į privatumo susirūpinimą ir vyriausybės apribojimus, duomenų bazėje esanti asmeninė informacija tampa vis labiau reglamentuojama ir sudėtingesnė, todėl realaus pasaulio informaciją sunkiau naudoti kuriant naujas programas ir platformas. Sintetiniai duomenys gali suteikti kūrėjams sprendimą, kaip pakeisti labai jautrius duomenis.

    Sintetinių duomenų pasekmės 

    Platesnės sintetinių duomenų pasekmės gali būti:

    • Paspartintas naujų AI sistemų kūrimas tiek mastu, tiek įvairove, kurios pagerina procesus daugelyje pramonės šakų ir disciplinos sričių, todėl padidėja efektyvumas tokiuose sektoriuose kaip sveikatos priežiūra, transportas ir finansai.
    • Leidžia organizacijoms atviriau dalytis informacija, o komandoms – bendradarbiauti ir veikti efektyviau, todėl darbo aplinka tampa darnesnė ir lengviau sprendžiami sudėtingi projektai.
    • Kūrėjai ir duomenų specialistai gali siųsti el. paštu arba nešiojamuosiuose kompiuteriuose nešiotis didelius sintetinių duomenų rinkinius, žinodami, kad svarbūs duomenys nekelia pavojaus, todėl darbo sąlygos yra lankstesnės ir saugesnės.
    • Sumažėjęs duomenų bazių kibernetinio saugumo pažeidimų dažnis, nes autentiškų duomenų nebereikės taip dažnai pasiekti ar jais dalytis, todėl įmonėms ir asmenims bus sukurta saugesnė skaitmeninė aplinka.
    • Vyriausybės įgyja daugiau laisvės įgyvendinti griežtesnius duomenų valdymo teisės aktus, nesijaudindamos, kad gali trukdyti AI sistemų plėtrai pramonėje, todėl duomenų naudojimo aplinka bus labiau reguliuojama ir skaidresnė.
    • Galimybė, kad sintetiniai duomenys gali būti neetiškai naudojami kuriant klastotes ar kitą manipuliuojančią laikmeną, o tai lemia dezinformaciją ir pasitikėjimo skaitmeniniu turiniu eroziją.
    • Pasikeitus darbo rinkos dinamikai, kai labiau pasikliaujama sintetiniais duomenimis, gali sumažėti duomenų rinkimo poreikis, o tai lemia darbo vietų perkėlimą tam tikruose sektoriuose.
    • Galimas padidėjusių skaičiavimo išteklių, reikalingų sintetiniams duomenims generuoti ir tvarkyti, poveikis aplinkai, dėl kurio padidės energijos suvartojimas ir susirūpinimas aplinka.

    Klausimai, kuriuos reikia apsvarstyti

    • Kokioms kitoms pramonės šakoms gali būti naudingi sintetiniai duomenys?
    • Kokius teisės aktus vyriausybė turėtų įgyvendinti dėl sintetinių duomenų kūrimo, naudojimo ir diegimo? 

    Įžvalgos nuorodos

    Šioje įžvalgoje buvo nurodytos šios populiarios ir institucinės nuorodos: