Dati sintetici: creazione di sistemi di intelligenza artificiale accurati utilizzando modelli fabbricati

CREDITO IMMAGINE:
Immagine di credito
iStock

Dati sintetici: creazione di sistemi di intelligenza artificiale accurati utilizzando modelli fabbricati

Dati sintetici: creazione di sistemi di intelligenza artificiale accurati utilizzando modelli fabbricati

Testo del sottotitolo
Per creare modelli accurati di intelligenza artificiale (AI), i dati simulati creati da un algoritmo stanno vedendo una maggiore utilità.
    • Autore:
    • Nome dell'autore
      Preveggenza quantistica
    • 4 Maggio 2022

    Riepilogo approfondimenti

    I dati sintetici, uno strumento potente che ha applicazioni che vanno dall’assistenza sanitaria alla vendita al dettaglio, stanno rimodellando il modo in cui i sistemi di intelligenza artificiale vengono sviluppati e implementati. Consentendo la creazione di set di dati diversi e complessi senza mettere in pericolo le informazioni sensibili, i dati sintetici stanno migliorando l’efficienza in tutti i settori, preservando la privacy e riducendo i costi. Tuttavia, presenta anche sfide, come il potenziale uso improprio nella creazione di media ingannevoli, preoccupazioni ambientali legate al consumo di energia e cambiamenti nelle dinamiche del mercato del lavoro che devono essere gestiti con attenzione.

    Contesto dei dati sintetici

    Per decenni, i dati sintetici sono esistiti in forme diverse. Può essere trovato nei giochi per computer come i simulatori di volo e nelle simulazioni fisiche che descrivono di tutto, dagli atomi alle galassie. Ora, i dati sintetici vengono applicati in settori come quello sanitario per risolvere le sfide dell'IA del mondo reale.

    Il progresso dell'IA continua a incontrare diversi ostacoli all'implementazione. Set di dati di grandi dimensioni, ad esempio, sono necessari per fornire risultati affidabili, essere privi di pregiudizi e aderire a normative sulla privacy dei dati sempre più severe. In mezzo a queste sfide, i dati annotati creati da simulazioni o programmi computerizzati sono emersi come un'alternativa ai dati autentici. Questi dati creati dall'intelligenza artificiale, noti come dati sintetici, sono fondamentali per risolvere i problemi di privacy e sradicare i pregiudizi poiché possono garantire una diversità di dati che riflette il mondo reale.

    Gli operatori sanitari utilizzano dati sintetici, ad esempio, nel settore delle immagini mediche per addestrare i sistemi di intelligenza artificiale mantenendo la riservatezza dei pazienti. L’azienda di assistenza virtuale Curai, ad esempio, ha utilizzato 400,000 casi medici sintetici per addestrare un algoritmo diagnostico. Inoltre, rivenditori come Caper utilizzano simulazioni 3D per creare un set di dati sintetico di mille fotografie da appena cinque scatti di prodotto. Secondo uno studio Gartner pubblicato nel giugno 2021 incentrato sui dati sintetici, la maggior parte dei dati utilizzati nello sviluppo dell’intelligenza artificiale saranno prodotti artificialmente mediante legislazione, standard statistici, simulazioni o altri mezzi entro il 2030.

    Impatto dirompente

    I dati sintetici aiutano a preservare la privacy e prevenire le violazioni dei dati. Ad esempio, un ospedale o un'azienda può offrire a uno sviluppatore dati medici sintetici di alta qualità per addestrare un sistema di diagnosi del cancro basato sull'intelligenza artificiale, dati complessi quanto i dati del mondo reale che questo sistema dovrebbe interpretare. In questo modo, gli sviluppatori dispongono di set di dati di qualità da utilizzare durante la progettazione e la compilazione del sistema e la rete ospedaliera non corre il rischio di mettere in pericolo i dati medici sensibili dei pazienti. 

    I dati sintetici possono inoltre consentire agli acquirenti di dati di test di accedere alle informazioni a un prezzo inferiore rispetto ai servizi tradizionali. Secondo Paul Walborsky, co-fondatore di AI Reverie, una delle prime aziende dedicate ai dati sintetici, una singola immagine che costa $ 6 da un servizio di etichettatura può essere generata artificialmente per sei centesimi. Al contrario, i dati sintetici apriranno la strada ai dati aumentati, che comportano l'aggiunta di nuovi dati a un set di dati esistente nel mondo reale. Gli sviluppatori possono ruotare o illuminare una vecchia immagine per crearne una nuova. 

    Infine, date le preoccupazioni sulla privacy e le restrizioni governative, le informazioni personali esistenti in un database stanno diventando sempre più legislative e complesse, rendendo più difficile l'utilizzo delle informazioni del mondo reale per creare nuovi programmi e piattaforme. I dati sintetici potrebbero fornire agli sviluppatori una soluzione alternativa per sostituire i dati altamente sensibili.

    Implicazioni dei dati sintetici 

    Implicazioni più ampie dei dati sintetici possono includere:

    • Lo sviluppo accelerato di nuovi sistemi di intelligenza artificiale, sia in termini di scala che di diversità, che migliorano i processi in numerosi settori e campi disciplinari, portando a una maggiore efficienza in settori come la sanità, i trasporti e la finanza.
    • Consentire alle organizzazioni di condividere le informazioni in modo più aperto e ai team di collaborare e operare in modo più efficiente, creando un ambiente di lavoro più coeso e la capacità di affrontare progetti complessi con facilità.
    • Sviluppatori e professionisti dei dati possono inviare e-mail o trasportare grandi set di dati sintetici sui propri laptop, sicuri di sapere che i dati critici non sono in pericolo, il che porta a condizioni di lavoro più flessibili e sicure.
    • La ridotta frequenza delle violazioni della sicurezza informatica dei database, poiché non sarà più necessario accedere o condividere dati autentici, porterà a un ambiente digitale più sicuro sia per le aziende che per i privati.
    • I governi ottengono maggiore libertà nell’attuazione di una legislazione più rigorosa sulla gestione dei dati senza preoccuparsi di ostacolare lo sviluppo dei sistemi di intelligenza artificiale nel settore, portando a un panorama di utilizzo dei dati più regolamentato e trasparente.
    • La possibilità che i dati sintetici vengano utilizzati in modo non etico nella creazione di deepfake o altri media manipolativi, portando a disinformazione e erosione della fiducia nei contenuti digitali.
    • Un cambiamento nelle dinamiche del mercato del lavoro, con una maggiore dipendenza dai dati sintetici che potenzialmente riduce la necessità di ruoli di raccolta dati, portando allo spostamento di posti di lavoro in alcuni settori.
    • Il potenziale impatto ambientale delle maggiori risorse computazionali necessarie per generare e gestire dati sintetici, che porta a un maggiore consumo di energia e alle preoccupazioni ambientali associate.

    Domande da considerare

    • Quali altri settori potrebbero trarre vantaggio dai dati sintetici?
    • Quali regolamenti dovrebbe attuare il governo in merito alla modalità di creazione, utilizzo e distribuzione dei dati sintetici? 

    Riferimenti di approfondimento

    I seguenti collegamenti popolari e istituzionali sono stati referenziati per questa intuizione: