Sintetiese data: Die skep van akkurate KI-stelsels met behulp van vervaardigde modelle

BEELDKREDIET:
Image krediet
iStock

Sintetiese data: Die skep van akkurate KI-stelsels met behulp van vervaardigde modelle

Sintetiese data: Die skep van akkurate KI-stelsels met behulp van vervaardigde modelle

Subopskrif teks
Om akkurate kunsmatige intelligensie-modelle (KI) te skep, word gesimuleerde data wat deur 'n algoritme geskep is, meer nut gesien.
    • Author:
    • Author naam
      Quantumrun Foresight
    • Mag 4, 2022

    Insig opsomming

    Sintetiese data, 'n kragtige instrument wat toepassings het wat wissel van gesondheidsorg tot kleinhandel, hervorm die manier waarop KI-stelsels ontwikkel en geïmplementeer word. Deur die skepping van diverse en komplekse datastelle moontlik te maak sonder om sensitiewe inligting in gevaar te stel, verbeter sintetiese data doeltreffendheid oor bedrywe heen, bewaar privaatheid en verminder koste. Dit bied egter ook uitdagings, soos potensiële misbruik in die skep van misleidende media, omgewingsbekommernisse wat verband hou met energieverbruik, en verskuiwings in arbeidsmarkdinamika wat versigtig bestuur moet word.

    Sintetiese datakonteks

    Vir dekades bestaan ​​sintetiese data in verskillende vorme. Dit kan gevind word in rekenaarspeletjies soos vlugsimulators en in fisika-simulasies wat alles van atome tot sterrestelsels uitbeeld. Nou word sintetiese data binne nywerhede soos gesondheidsorg toegepas om werklike KI-uitdagings op te los.

    Die vooruitgang van KI kom steeds teë met verskeie implementeringshindernisse. Groot datastelle word byvoorbeeld vereis om betroubare bevindings te lewer, vry van vooroordeel te wees en aan toenemend strenger dataprivaatheidsregulasies te voldoen. Te midde van hierdie uitdagings het geannoteerde data geskep deur gerekenariseerde simulasies of programme na vore gekom as 'n alternatief vir ware data. Hierdie KI-geskepte data, bekend as sintetiese data, is van kritieke belang om privaatheidskwessies op te los en vooroordeel uit te roei, aangesien dit datadiversiteit kan verseker wat die werklike wêreld weerspieël.

    Gesondheidsorgpraktisyns gebruik sintetiese data, as 'n voorbeeld, binne die mediese beeldsektor om KI-stelsels op te lei terwyl pasiëntvertroulikheid gehandhaaf word. Die virtuele sorgfirma, Curai, het byvoorbeeld 400,000 3 sintetiese mediese gevalle gebruik om 'n diagnose-algoritme op te lei. Verder gebruik kleinhandelaars soos Caper 2021D-simulasies om 'n sintetiese datastel van 'n duisend foto's van so min as vyf produkskote te skep. Volgens 'n Gartner-studie wat in Junie 2030 vrygestel is en gefokus op sintetiese data, sal die meeste van die data wat in KI-ontwikkeling gebruik word, kunsmatig vervaardig word deur wetgewing, statistiese standaarde, simulasies of ander maniere teen XNUMX.

    Ontwrigtende impak

    Sintetiese data help met die behoud van privaatheid en die voorkoming van data-oortredings. Byvoorbeeld, 'n hospitaal of korporasie kan 'n ontwikkelaar sintetiese mediese data van hoë gehalte bied om 'n KI-gebaseerde kankerdiagnosestelsel op te lei - data wat so kompleks is soos die werklike data wat hierdie stelsel bedoel is om te interpreteer. Op hierdie manier het die ontwikkelaars kwaliteit datastelle om te gebruik wanneer die stelsel ontwerp en saamgestel word, en die hospitaalnetwerk loop nie die risiko om sensitiewe, pasiënt mediese data in gevaar te stel nie. 

    Sintetiese data kan kopers van toetsdata verder toelaat om toegang te verkry tot inligting teen 'n laer prys as tradisionele dienste. Volgens Paul Walborsky, medestigter van AI Reverie, een van die eerste toegewyde sintetiese data-ondernemings, kan 'n enkele beeld wat $6 kos uit 'n etiketteringdiens kunsmatig vir ses sent gegenereer word. Omgekeerd sal sintetiese data die weg baan vir uitgebreide data, wat die toevoeging van nuwe data tot 'n bestaande werklike datastel behels. Ontwikkelaars kan 'n ou prent draai of verhelder om 'n nuwe een te maak. 

    Laastens, gegewe privaatheidskwessies en regeringsbeperkings, word persoonlike inligting wat in 'n databasis bestaan, toenemend wetgewing en kompleks, wat dit moeiliker maak vir werklike inligting om gebruik te word om nuwe programme en platforms te skep. Sintetiese data kan ontwikkelaars 'n oplossing bied om hoogs sensitiewe data te vervang.

    Implikasies van sintetiese data 

    Wyer implikasies van sintetiese data kan die volgende insluit:

    • Die versnelde ontwikkeling van nuwe KI-stelsels, beide in skaal en diversiteit, wat prosesse in talle nywerhede en vakgebiede verbeter, wat lei tot verbeterde doeltreffendheid in sektore soos gesondheidsorg, vervoer en finansies.
    • Om organisasies in staat te stel om inligting meer openlik te deel en spanne om meer doeltreffend saam te werk en te werk, wat lei tot 'n meer samehangende werksomgewing en die vermoë om komplekse projekte met gemak aan te pak.
    • Ontwikkelaars en data-professionele persone kan e-pos stuur of groot sintetiese datastelle op hul skootrekenaars dra, veilig in die wete dat kritieke data nie in gevaar gestel word nie, wat lei tot meer buigsame en veilige werksomstandighede.
    • Die verminderde frekwensie van databasiskuberveiligheidsoortredings, aangesien outentieke data nie meer so gereeld toegang of gedeel sal hoef te word nie, wat lei tot 'n veiliger digitale omgewing vir ondernemings en individue.
    • Regerings kry meer vryheid om strenger databestuurswetgewing te implementeer sonder om bekommerd te wees oor die belemmering van die industrie-ontwikkeling van KI-stelsels, wat lei tot 'n meer gereguleerde en deursigtige datagebruiklandskap.
    • Die potensiaal vir sintetiese data om oneties gebruik te word in die skep van diepvals of ander manipulerende media, wat lei tot verkeerde inligting en erosie van vertroue in digitale inhoud.
    • 'n Verskuiwing in arbeidsmarkdinamika, met verhoogde afhanklikheid van sintetiese data wat moontlik die behoefte aan data-insamelingsrolle verminder, wat lei tot werksverplasing in sekere sektore.
    • Die potensiële omgewingsimpak van verhoogde berekeningshulpbronne wat benodig word om sintetiese data te genereer en te bestuur, wat lei tot hoër energieverbruik en gepaardgaande omgewingsbekommernisse.

    Vrae om te oorweeg

    • Watter ander bedrywe kan baat vind by sintetiese data?
    • Watter regulasies moet die regering implementeer oor hoe sintetiese data geskep, gebruik en ontplooi word? 

    Insig verwysings

    Die volgende gewilde en institusionele skakels is vir hierdie insig verwys: