Sintetički podaci: Stvaranje točnih AI sustava pomoću proizvedenih modela

KREDIT ZA SLIKE:
Slika kreditne
Istockphoto

Sintetički podaci: Stvaranje točnih AI sustava pomoću proizvedenih modela

Sintetički podaci: Stvaranje točnih AI sustava pomoću proizvedenih modela

Tekst podnaslova
Za stvaranje točnih modela umjetne inteligencije (AI), simulirani podaci stvoreni algoritmom imaju povećanu korisnost.
    • Autor:
    • ime autora
      Quantumrun Foresight
    • Neka 4, 2022

    Sažetak uvida

    Sintetički podaci, moćan alat koji ima različite primjene od zdravstva do maloprodaje, preoblikuju način na koji se sustavi umjetne inteligencije razvijaju i implementiraju. Omogućujući stvaranje raznolikih i složenih skupova podataka bez ugrožavanja osjetljivih informacija, sintetički podaci poboljšavaju učinkovitost u svim industrijama, čuvaju privatnost i smanjuju troškove. Međutim, to također predstavlja izazove, kao što je potencijalna zlouporaba u stvaranju obmanjujućih medija, zabrinutost za okoliš povezana s potrošnjom energije i promjene u dinamici tržišta rada kojima treba pažljivo upravljati.

    Kontekst sintetičkih podataka

    Desetljećima su sintetski podaci postojali u različitim oblicima. Može se naći u računalnim igrama poput simulatora letenja iu fizičkim simulacijama koje prikazuju sve, od atoma do galaksija. Sada se sintetički podaci primjenjuju u industrijama kao što je zdravstvo za rješavanje izazova umjetne inteligencije u stvarnom svijetu.

    Napredak umjetne inteligencije i dalje nailazi na nekoliko prepreka implementaciji. Na primjer, veliki skupovi podataka potrebni su za pružanje pouzdanih nalaza, bez pristranosti i pridržavanje sve strožih propisa o privatnosti podataka. Usred ovih izazova, označeni podaci stvoreni kompjuteriziranim simulacijama ili programima pojavili su se kao alternativa pravim podacima. Ovi podaci koje je stvorila umjetna inteligencija, poznati kao sintetički podaci, ključni su za rješavanje pitanja privatnosti i iskorjenjivanje predrasuda budući da mogu osigurati raznolikost podataka koja odražava stvarni svijet.

    Zdravstveni praktičari koriste sintetičke podatke, kao primjer, unutar sektora medicinskih slika kako bi uvježbali AI sustave uz zadržavanje povjerljivosti pacijenata. Tvrtka za virtualnu njegu, Curai, na primjer, koristila je 400,000 3 sintetičkih medicinskih slučajeva za treniranje dijagnostičkog algoritma. Nadalje, trgovci kao što je Caper koriste 2021D simulacije za stvaranje sintetičkog skupa podataka od tisuću fotografija od samo pet snimaka proizvoda. Prema Gartnerovoj studiji objavljenoj u lipnju 2030. usredotočenoj na sintetičke podatke, većina podataka korištenih u razvoju umjetne inteligencije bit će umjetno proizvedena zakonodavstvom, statističkim standardima, simulacijama ili drugim sredstvima do XNUMX.

    Razarajući učinak

    Sintetički podaci pomažu u očuvanju privatnosti i sprječavanju povreda podataka. Na primjer, bolnica ili korporacija može programeru ponuditi visokokvalitetne sintetičke medicinske podatke za obuku sustava za dijagnozu raka temeljenog na umjetnoj inteligenciji - podatke koji su jednako složeni kao i podaci iz stvarnog svijeta koje bi ovaj sustav trebao tumačiti. Na ovaj način programeri imaju kvalitetne skupove podataka koje mogu koristiti pri projektiranju i kompajliranju sustava, a bolnička mreža nije izložena riziku ugrožavanja osjetljivih medicinskih podataka pacijenata. 

    Sintetički podaci mogu dodatno omogućiti kupcima podataka za testiranje pristup informacijama po nižoj cijeni od tradicionalnih usluga. Prema Paulu Walborskyju, koji je suosnivač AI Reverie, jedne od prvih tvrtki posvećenih sintetskim podacima, jedna slika koja košta 6 dolara od usluge označavanja može se umjetno generirati za šest centi. Suprotno tome, sintetički podaci otvorit će put za proširene podatke, što podrazumijeva dodavanje novih podataka u postojeći skup podataka iz stvarnog svijeta. Programeri bi mogli rotirati ili posvijetliti staru sliku kako bi napravili novu. 

    Na kraju, s obzirom na brigu o privatnosti i vladina ograničenja, osobni podaci koji postoje u bazi podataka postaju sve više zakonski propisani i složeni, što otežava korištenje informacija iz stvarnog svijeta za stvaranje novih programa i platformi. Sintetički podaci mogli bi programerima pružiti zaobilazno rješenje za zamjenu vrlo osjetljivih podataka.

    Implikacije sintetičkih podataka 

    Šire implikacije sintetičkih podataka mogu uključivati:

    • Ubrzani razvoj novih AI sustava, kako u veličini tako iu raznolikosti, koji poboljšavaju procese u brojnim industrijama i područjima discipline, što dovodi do poboljšane učinkovitosti u sektorima kao što su zdravstvo, transport i financije.
    • Omogućuje organizacijama da otvorenije dijele informacije, a timovima da surađuju i djeluju učinkovitije, što dovodi do kohezivnijeg radnog okruženja i mogućnosti da se s lakoćom bave složenim projektima.
    • Programeri i stručnjaci za podatke mogu slati e-poštom ili nositi velike skupove sintetičkih podataka na svojim prijenosnim računalima, sigurni znajući da kritični podaci nisu ugroženi, što dovodi do fleksibilnijih i sigurnijih radnih uvjeta.
    • Smanjena učestalost kršenja kibernetičke sigurnosti baze podataka, budući da autentičnim podacima više neće biti potrebno pristupati ili dijeliti tako često, što dovodi do sigurnijeg digitalnog okruženja za tvrtke i pojedince.
    • Vlade dobivaju više slobode za provedbu strožih zakona o upravljanju podacima bez brige o ometanju industrijskog razvoja sustava umjetne inteligencije, što dovodi do reguliranijeg i transparentnijeg krajolika korištenja podataka.
    • Mogućnost da se sintetički podaci neetički koriste u stvaranju dubokih krivotvorina ili drugih manipulativnih medija, što dovodi do dezinformacija i erozije povjerenja u digitalni sadržaj.
    • Promjena u dinamici tržišta rada, s povećanim oslanjanjem na sintetičke podatke potencijalno smanjuje potrebu za ulogama prikupljanja podataka, što dovodi do premještanja poslova u određenim sektorima.
    • Potencijalni utjecaj na okoliš povećanih računalnih resursa potrebnih za generiranje sintetičkih podataka i upravljanje njima, što dovodi do veće potrošnje energije i povezanih briga za okoliš.

    Pitanja za razmatranje

    • Koje bi druge industrije mogle imati koristi od sintetičkih podataka?
    • Koje bi propise vlada trebala provesti u vezi s načinom na koji se sintetički podaci stvaraju, koriste i postavljaju? 

    Reference uvida

    Za ovaj uvid korištene su sljedeće popularne i institucionalne veze: