Dades sintètiques: creació de sistemes d'IA precisos mitjançant models fabricats

CRÈDIT DE LA IMATGE:
Crèdit d'imatge
iStock

Dades sintètiques: creació de sistemes d'IA precisos mitjançant models fabricats

Dades sintètiques: creació de sistemes d'IA precisos mitjançant models fabricats

Text del subtítol
Per crear models d'intel·ligència artificial (IA) precisos, les dades simulades creades per un algorisme estan augmentant la utilitat.
    • autor:
    • nom de l'autor
      Previsió de Quantumrun
    • Pot 4, 2022

    Resum d'informació

    Les dades sintètiques, una eina poderosa que té aplicacions que van des de la sanitat fins a la venda al detall, estan remodelant la manera com es desenvolupen i s'implementen els sistemes d'IA. En permetre la creació de conjunts de dades diversos i complexos sense posar en perill la informació sensible, les dades sintètiques milloren l'eficiència en totes les indústries, preserven la privadesa i redueixen els costos. Tanmateix, també presenta reptes, com ara un possible mal ús per crear mitjans enganyosos, preocupacions ambientals relacionades amb el consum d'energia i canvis en la dinàmica del mercat laboral que cal gestionar amb cura.

    Context de dades sintètiques

    Durant dècades, les dades sintètiques han existit de diferents formes. Es pot trobar en jocs d'ordinador com simuladors de vol i en simulacions físiques que representen tot, des d'àtoms fins a galàxies. Ara, les dades sintètiques s'estan aplicant a indústries com la sanitària per resoldre reptes d'IA del món real.

    L'avenç de la IA continua trobant-se amb diversos obstacles d'implementació. Els grans conjunts de dades, per exemple, són necessaris per oferir troballes fiables, estar lliures de biaix i adherir-se a regulacions de privadesa de dades cada cop més estrictes. Enmig d'aquests reptes, les dades anotades creades per simulacions o programes informatitzats han sorgit com una alternativa a les dades genuïnes. Aquestes dades creades per IA, conegudes com a dades sintètiques, són fonamentals per resoldre els problemes de privadesa i eradicar els prejudicis, ja que poden garantir una diversitat de dades que reflecteixi el món real.

    Els professionals de la salut utilitzen dades sintètiques, com a exemple, dins del sector d'imatges mèdiques per entrenar sistemes d'IA mantenint la confidencialitat del pacient. L'empresa d'atenció virtual, Curai, per exemple, va utilitzar 400,000 casos mèdics sintètics per entrenar un algorisme de diagnòstic. A més, minoristes com Caper utilitzen simulacions 3D per crear un conjunt de dades sintètics de mil fotografies a partir de tan sols cinc fotografies de productes. Segons un estudi de Gartner publicat el juny de 2021 centrat en dades sintètiques, la majoria de les dades utilitzades en el desenvolupament de la IA es fabricaran artificialment per llei, estàndards estadístics, simulacions o altres mitjans per al 2030.

    Impacte disruptiu

    Les dades sintètiques ajuden a preservar la privadesa i a prevenir les violacions de dades. Per exemple, un hospital o una corporació poden oferir a un desenvolupador dades mèdiques sintètiques d'alta qualitat per entrenar un sistema de diagnòstic de càncer basat en IA: dades tan complexes com les dades del món real que ha d'interpretar aquest sistema. D'aquesta manera, els desenvolupadors tenen conjunts de dades de qualitat per utilitzar a l'hora de dissenyar i compilar el sistema, i la xarxa hospitalària no corre el risc de posar en perill les dades mèdiques sensibles dels pacients. 

    Les dades sintètiques també poden permetre als compradors de dades de prova accedir a la informació a un preu més baix que els serveis tradicionals. Segons Paul Walborsky, que va cofundar AI Reverie, una de les primeres empreses dedicades a dades sintètiques, una única imatge que costa 6 dòlars d'un servei d'etiquetatge es pot generar artificialment per sis cèntims. Per contra, les dades sintètiques obriran el camí per a les dades augmentades, la qual cosa implica afegir noves dades a un conjunt de dades del món real existent. Els desenvolupadors podrien girar o il·luminar una imatge antiga per fer-ne una de nova. 

    Finalment, tenint en compte les preocupacions de privadesa i les restriccions governamentals, la informació personal existent en una base de dades és cada cop més legalitzada i complexa, cosa que fa que sigui més difícil que la informació del món real s'utilitzi per crear nous programes i plataformes. Les dades sintètiques podrien proporcionar als desenvolupadors una solució alternativa per substituir dades altament sensibles.

    Implicacions de les dades sintètiques 

    Les implicacions més àmplies de les dades sintètiques poden incloure:

    • El desenvolupament accelerat de nous sistemes d'IA, tant en escala com en diversitat, que milloren els processos en nombroses indústries i camps de la disciplina, donant lloc a una millora de l'eficiència en sectors com la sanitat, el transport i les finances.
    • Permet que les organitzacions comparteixin informació de manera més oberta i que els equips col·laborin i funcionin de manera més eficient, donant lloc a un entorn de treball més cohesionat i a la capacitat d'abordar projectes complexos amb facilitat.
    • Els desenvolupadors i professionals de les dades poden enviar per correu electrònic o portar grans conjunts de dades sintètiques als seus ordinadors portàtils, segurs de saber que les dades crítiques no es posen en perill, cosa que condueix a unes condicions de treball més flexibles i segures.
    • La freqüència reduïda de les infraccions de la ciberseguretat de les bases de dades, ja que les dades autèntiques ja no caldrà accedir ni compartir-les amb tanta freqüència, donant lloc a un entorn digital més segur per a empreses i particulars.
    • Els governs guanyen més llibertat per implementar una legislació de gestió de dades més estricta sense preocupar-se d'impedir el desenvolupament de la indústria de sistemes d'IA, donant lloc a un panorama d'ús de dades més regulat i transparent.
    • La possibilitat que les dades sintètiques s'utilitzin de manera no ètica en la creació de falsificacions profundes o altres mitjans manipulatius, la qual cosa condueix a la desinformació i l'erosió de la confiança en el contingut digital.
    • Un canvi en la dinàmica del mercat de treball, amb una major dependència de les dades sintètiques que pot reduir la necessitat de rols de recollida de dades, provocant el desplaçament de llocs de treball en determinats sectors.
    • L'impacte ambiental potencial de l'augment dels recursos computacionals necessaris per generar i gestionar dades sintètiques, provocant un major consum d'energia i preocupacions ambientals associades.

    Preguntes a tenir en compte

    • Quines altres indústries podrien beneficiar-se de les dades sintètiques?
    • Quines regulacions hauria d'implementar el govern sobre com es creen, s'utilitzen i es despleguen les dades sintètiques? 

    Referències insight

    Es va fer referència als següents enllaços populars i institucionals per a aquesta visió: