Syntetisk data: Skapa korrekta AI-system med hjälp av tillverkade modeller

BILDKREDIT:
Bild kredit
iStock

Syntetisk data: Skapa korrekta AI-system med hjälp av tillverkade modeller

Syntetisk data: Skapa korrekta AI-system med hjälp av tillverkade modeller

Underrubrik text
För att skapa exakta modeller för artificiell intelligens (AI) får simulerad data skapad av en algoritm ökad användbarhet.
    • Författare:
    • författarnamn
      Quantumrun Framsyn
    • Maj 4, 2022

    Insiktssammanfattning

    Syntetisk data, ett kraftfullt verktyg som har applikationer som sträcker sig från hälsovård till detaljhandel, omformar hur AI-system utvecklas och implementeras. Genom att möjliggöra skapandet av olika och komplexa datauppsättningar utan att äventyra känslig information, förbättrar syntetisk data effektiviteten inom olika branscher, bevarar integriteten och minskar kostnaderna. Men det innebär också utmaningar, såsom potentiellt missbruk för att skapa vilseledande medier, miljöhänsyn relaterade till energiförbrukning och förändringar i arbetsmarknadens dynamik som måste hanteras noggrant.

    Syntetisk datakontext

    I decennier har syntetisk data funnits i olika former. Det kan finnas i datorspel som flygsimulatorer och i fysiksimuleringar som skildrar allt från atomer till galaxer. Nu används syntetisk data inom branscher som sjukvård för att lösa verkliga AI-utmaningar.

    Utvecklingen av AI fortsätter att stöta på flera implementeringshinder. Stora datamängder krävs till exempel för att leverera tillförlitliga resultat, vara fria från partiskhet och följa allt strängare regler för datasekretess. Mitt i dessa utmaningar har kommenterad data skapad av datoriserade simuleringar eller program dykt upp som ett alternativ till äkta data. Denna AI-skapade data, känd som syntetisk data, är avgörande för att lösa integritetsproblem och utrota fördomar, eftersom det kan säkerställa en mångfald av data som återspeglar den faktiska världen.

    Sjukvårdsutövare använder syntetiska data, som ett exempel, inom sektorn för medicinska bilder för att träna AI-system samtidigt som patientens konfidentialitet bibehålls. Det virtuella vårdföretaget Curai använde till exempel 400,000 3 syntetiska medicinska fall för att träna en diagnosalgoritm. Dessutom använder återförsäljare som Caper 2021D-simuleringar för att skapa en syntetisk datauppsättning med tusen fotografier från så lite som fem produktbilder. Enligt en Gartner-studie som släpptes i juni 2030 med fokus på syntetisk data, kommer de flesta av de data som används i AI-utveckling att vara konstgjorda tillverkade av lagstiftning, statistiska standarder, simuleringar eller andra metoder senast XNUMX.

    Störande inverkan

    Syntetisk data hjälper till att bevara integriteten och förebygga dataintrång. Till exempel kan ett sjukhus eller ett företag erbjuda en utvecklare syntetisk medicinsk data av hög kvalitet för att träna ett AI-baserat cancerdiagnossystem – data som är lika komplexa som den verkliga data som detta system är avsett att tolka. På så sätt har utvecklarna kvalitetsdatauppsättningar att använda vid design och sammanställning av systemet, och sjukhusnätverket riskerar inte att äventyra känslig, patientmedicinsk data. 

    Syntetisk data kan dessutom ge köpare av testdata tillgång till information till ett lägre pris än traditionella tjänster. Enligt Paul Walborsky, som var med och grundade AI Reverie, en av de första dedikerade syntetiska dataföretagen, kan en enda bild som kostar $6 från en märkningstjänst skapas artificiellt för sex cent. Omvänt kommer syntetisk data att bana väg för utökad data, vilket innebär att man lägger till ny data till en befintlig datauppsättning i verkligheten. Utvecklare kan rotera eller göra en gammal bild ljusare för att skapa en ny. 

    Slutligen, med tanke på integritetsproblem och statliga begränsningar, blir personlig information som finns i en databas alltmer lagstiftad och komplex, vilket gör det svårare för verklig information att användas för att skapa nya program och plattformar. Syntetisk data kan ge utvecklare en lösning för att ersätta mycket känslig data.

    Konsekvenser av syntetiska data 

    Vidare implikationer av syntetiska data kan inkludera:

    • Den accelererade utvecklingen av nya AI-system, både i skala och mångfald, som förbättrar processer inom många branscher och disciplinområden, vilket leder till ökad effektivitet inom sektorer som hälsovård, transport och finans.
    • Gör det möjligt för organisationer att dela information mer öppet och team att samarbeta och arbeta mer effektivt, vilket leder till en mer sammanhållen arbetsmiljö och förmågan att hantera komplexa projekt med lätthet.
    • Utvecklare och dataproffs som kan skicka e-post eller bära stora syntetiska datamängder på sina bärbara datorer, trygga med att veta att kritisk data inte äventyras, vilket leder till flexiblare och säkrare arbetsförhållanden.
    • Den minskade frekvensen av databassäkerhetsintrång, eftersom autentisk data inte längre behöver nås eller delas lika ofta, vilket leder till en säkrare digital miljö för både företag och privatpersoner.
    • Regeringar får större frihet att implementera striktare datahanteringslagstiftning utan att oroa sig för att hindra industrins utveckling av AI-system, vilket leder till ett mer reglerat och transparent dataanvändningslandskap.
    • Potentialen för att syntetisk data kan användas oetiskt för att skapa djupförfalskningar eller andra manipulativa medier, vilket leder till felaktig information och urholkning av förtroendet för digitalt innehåll.
    • En förändring av arbetsmarknadens dynamik, med ökat beroende av syntetiska data, kan potentiellt minska behovet av datainsamlingsroller, vilket leder till arbetsförflyttning inom vissa sektorer.
    • Den potentiella miljöpåverkan av ökade beräkningsresurser som krävs för att generera och hantera syntetisk data, vilket leder till högre energiförbrukning och tillhörande miljöhänsyn.

    Frågor att överväga

    • Vilka andra branscher skulle kunna dra nytta av syntetisk data?
    • Vilka regler bör regeringen införa om hur syntetisk data skapas, används och distribueras? 

    Insiktsreferenser

    Följande populära och institutionella länkar hänvisades till för denna insikt: