Sintetički podaci: Stvaranje tačnih AI sistema koristeći proizvedene modele

KREDIT ZA SLIKU:
Image credit
iStock

Sintetički podaci: Stvaranje tačnih AI sistema koristeći proizvedene modele

Sintetički podaci: Stvaranje tačnih AI sistema koristeći proizvedene modele

Tekst podnaslova
Za kreiranje preciznih modela umjetne inteligencije (AI), simulirani podaci kreirani algoritmom postaju sve korisniji.
    • Autor:
    • Ime autora
      Quantumrun Foresight
    • Može 4, 2022

    Sažetak uvida

    Sintetički podaci, moćan alat koji ima aplikacije u rasponu od zdravstvene zaštite do maloprodaje, preoblikuje način na koji se AI sistemi razvijaju i implementiraju. Omogućavanjem stvaranja raznolikih i složenih skupova podataka bez ugrožavanja osjetljivih informacija, sintetički podaci povećavaju efikasnost u svim industrijama, čuvajući privatnost i smanjujući troškove. Međutim, on takođe predstavlja izazove, kao što su potencijalna zloupotreba u stvaranju obmanjujućih medija, zabrinutost za životnu sredinu u vezi sa potrošnjom energije i promene u dinamici tržišta rada kojima treba pažljivo upravljati.

    Kontekst sintetičkih podataka

    Decenijama sintetički podaci postoje u različitim oblicima. Može se naći u kompjuterskim igrama kao što su simulatori leta i u simulacijama fizike koje prikazuju sve, od atoma do galaksija. Sada se sintetički podaci primjenjuju u industrijama kao što je zdravstvo za rješavanje izazova AI u stvarnom svijetu.

    Napredak AI i dalje nailazi na nekoliko prepreka implementaciji. Na primjer, potrebni su veliki skupovi podataka da bi se pružili pouzdani nalazi, bili bez pristrasnosti i pridržavali se sve strožih propisa o privatnosti podataka. Usred ovih izazova, anotirani podaci kreirani kompjuterizovanim simulacijama ili programima su se pojavili kao alternativa pravim podacima. Ovi podaci stvoreni umjetnom inteligencijom, poznati kao sintetički podaci, ključni su za rješavanje problema privatnosti i iskorjenjivanje predrasuda jer mogu osigurati raznolikost podataka koja odražava stvarni svijet.

    Zdravstveni radnici koriste sintetičke podatke, kao primjer, u sektoru medicinskih slika kako bi obučili AI sisteme uz očuvanje povjerljivosti pacijenata. Firma za virtuelnu njegu, Curai, na primjer, koristila je 400,000 sintetičkih medicinskih slučajeva da obuči algoritam za dijagnozu. Nadalje, trgovci na malo kao što je Caper koriste 3D simulacije da kreiraju sintetički skup podataka od hiljadu fotografija od samo pet snimaka proizvoda. Prema studiji Gartnera objavljenoj u junu 2021. usredsređenoj na sintetičke podatke, većina podataka koji se koriste u razvoju veštačke inteligencije biće veštački proizvedena zakonodavstvom, statističkim standardima, simulacijama ili drugim sredstvima do 2030. godine.

    Ometajući uticaj

    Sintetički podaci pomažu u očuvanju privatnosti i sprečavanju kršenja podataka. Na primjer, bolnica ili korporacija može ponuditi programeru visokokvalitetne sintetičke medicinske podatke za obuku sistema dijagnoze raka zasnovanog na umjetnoj inteligenciji – podatke koji su složeni koliko i podaci iz stvarnog svijeta koje ovaj sistem treba da tumači. Na ovaj način, programeri imaju kvalitetne skupove podataka koje koriste prilikom dizajniranja i kompajliranja sistema, a bolnička mreža ne rizikuje da ugrozi osjetljive medicinske podatke pacijenata. 

    Sintetički podaci mogu dalje omogućiti kupcima podataka za testiranje da pristupe informacijama po nižoj cijeni od tradicionalnih usluga. Prema Paulu Walborskyju, koji je suosnivač AI Reverie, jednog od prvih posvećenih sintetičkih poslova s ​​podacima, jedna slika koja košta 6 dolara od usluge označavanja može se umjetno generirati za šest centi. Suprotno tome, sintetički podaci će utrti put proširenim podacima, što podrazumijeva dodavanje novih podataka postojećem skupu podataka iz stvarnog svijeta. Programeri bi mogli rotirati ili posvijetliti staru sliku kako bi napravili novu. 

    Konačno, s obzirom na zabrinutost za privatnost i vladina ograničenja, lični podaci koji postoje u bazi podataka postaju sve više zakonski uređeni i složeniji, što otežava korištenje informacija iz stvarnog svijeta za kreiranje novih programa i platformi. Sintetički podaci mogu pružiti programerima rješenje za zaobilazno rješenje za zamjenu visoko osjetljivih podataka.

    Implikacije sintetičkih podataka 

    Šire implikacije sintetičkih podataka mogu uključivati:

    • Ubrzani razvoj novih AI sistema, kako u obimu tako i u raznolikosti, koji poboljšavaju procese u brojnim industrijama i oblastima discipline, što dovodi do poboljšane efikasnosti u sektorima kao što su zdravstvo, transport i finansije.
    • Omogućavanje organizacijama da otvorenije dijele informacije i timovima da sarađuju i rade efikasnije, što dovodi do kohezivnijeg radnog okruženja i sposobnosti da se s lakoćom bave složenim projektima.
    • Programeri i profesionalci za podatke koji mogu slati e-poštu ili nositi velike skupove sintetičkih podataka na svojim prijenosnim računalima, sigurni da znaju da kritični podaci nisu ugroženi, što dovodi do fleksibilnijih i sigurnijih radnih uvjeta.
    • Smanjena učestalost narušavanja sajber-sigurnosti baze podataka, jer autentičnim podacima više neće biti potrebno pristupati ili dijeliti tako često, što će dovesti do sigurnijeg digitalnog okruženja za poduzeća i pojedince.
    • Vlade dobijaju više slobode da implementiraju strožije zakone o upravljanju podacima bez brige o ometanju industrijskog razvoja AI sistema, što dovodi do uređenije i transparentnije upotrebe podataka.
    • Potencijal da se sintetički podaci neetički koriste u stvaranju deepfakesa ili drugih manipulativnih medija, što dovodi do dezinformacija i erozije povjerenja u digitalni sadržaj.
    • Promena dinamike tržišta rada, sa povećanim oslanjanjem na sintetičke podatke, potencijalno smanjuje potrebu za ulogama prikupljanja podataka, što dovodi do raseljavanja poslova u određenim sektorima.
    • Potencijalni uticaj na životnu sredinu povećanih računarskih resursa potrebnih za generisanje i upravljanje sintetičkim podacima, što dovodi do veće potrošnje energije i povezanih ekoloških problema.

    Pitanja koja treba razmotriti

    • Koje bi druge industrije mogle imati koristi od sintetičkih podataka?
    • Koje propise bi vlada trebala primijeniti u vezi s načinom na koji se sintetički podaci kreiraju, koriste i koriste? 

    Insight reference

    Za ovaj uvid referencirane su sljedeće popularne i institucionalne veze: