Date sintetice: crearea de sisteme AI precise folosind modele fabricate

CREDIT DE IMAGINE:
Imagine de credit
iStock

Date sintetice: crearea de sisteme AI precise folosind modele fabricate

Date sintetice: crearea de sisteme AI precise folosind modele fabricate

Textul subtitlului
Pentru a crea modele precise de inteligență artificială (AI), datele simulate create de un algoritm au o utilitate sporită.
    • Autor:
    • Numele autorului
      Previziune Quantumrun
    • 4 Mai, 2022

    Rezumat perspectivă

    Datele sintetice, un instrument puternic care are aplicații variind de la asistența medicală la comerțul cu amănuntul, remodelează modul în care sistemele AI sunt dezvoltate și implementate. Permițând crearea de seturi de date diverse și complexe fără a pune în pericol informațiile sensibile, datele sintetice îmbunătățesc eficiența în toate industriile, păstrând confidențialitatea și reducând costurile. Cu toate acestea, prezintă, de asemenea, provocări, cum ar fi potențiala utilizare abuzivă în crearea de media înșelătoare, preocupări de mediu legate de consumul de energie și schimbări în dinamica pieței muncii care trebuie gestionate cu atenție.

    Context de date sintetice

    De zeci de ani, datele sintetice au existat sub diferite forme. Poate fi găsit în jocurile pe computer, cum ar fi simulatoarele de zbor și în simulările de fizică care descriu totul, de la atomi la galaxii. Acum, datele sintetice sunt aplicate în industrii precum asistența medicală pentru a rezolva provocările AI din lumea reală.

    Avansarea IA continuă să se confrunte cu mai multe obstacole de implementare. Seturi mari de date, de exemplu, sunt necesare pentru a oferi constatări de încredere, pentru a fi lipsite de părtiniri și pentru a adera la reglementări din ce în ce mai stricte privind confidențialitatea datelor. În mijlocul acestor provocări, datele adnotate create prin simulări sau programe computerizate au apărut ca o alternativă la datele autentice. Aceste date create de AI, cunoscute sub numele de date sintetice, sunt esențiale pentru rezolvarea preocupărilor legate de confidențialitate și eradicarea prejudecăților, deoarece pot asigura diversitatea datelor care reflectă lumea actuală.

    Practicienii din domeniul sănătății folosesc date sintetice, de exemplu, în sectorul imaginilor medicale pentru a instrui sistemele AI, păstrând în același timp confidențialitatea pacientului. Firma de îngrijire virtuală, Curai, de exemplu, a folosit 400,000 de cazuri medicale sintetice pentru a antrena un algoritm de diagnosticare. În plus, comercianții cu amănuntul, cum ar fi Caper, folosesc simulări 3D pentru a crea un set de date sintetice de o mie de fotografii din cinci fotografii de produs. Potrivit unui studiu Gartner lansat în iunie 2021, axat pe date sintetice, majoritatea datelor utilizate în dezvoltarea AI vor fi produse artificial prin legislație, standarde statistice, simulări sau alte mijloace până în 2030.

    Impact perturbator

    Datele sintetice ajută la păstrarea confidențialității și la prevenirea încălcării datelor. De exemplu, un spital sau o corporație poate oferi unui dezvoltator date medicale sintetice de înaltă calitate pentru a instrui un sistem de diagnosticare a cancerului bazat pe inteligență artificială - date care sunt la fel de complexe ca datele din lumea reală pe care acest sistem este menit să le interpreteze. În acest fel, dezvoltatorii au seturi de date de calitate pe care să le folosească la proiectarea și compilarea sistemului, iar rețeaua de spitale nu riscă să pună în pericol datele medicale sensibile ale pacienților. 

    Datele sintetice pot permite cumpărătorilor de date de testare să acceseze informații la un preț mai mic decât serviciile tradiționale. Potrivit lui Paul Walborsky, care a co-fondat AI Reverie, una dintre primele afaceri de date sintetice dedicate, o singură imagine care costă 6 USD dintr-un serviciu de etichetare poate fi generată artificial pentru șase cenți. În schimb, datele sintetice vor deschide calea pentru date augmentate, ceea ce presupune adăugarea de noi date la un set de date existent din lumea reală. Dezvoltatorii pot roti sau lumina o imagine veche pentru a crea una nouă. 

    În cele din urmă, având în vedere preocupările legate de confidențialitate și restricțiile guvernamentale, informațiile personale existente într-o bază de date devin din ce în ce mai reglementate și complexe, ceea ce face mai dificilă utilizarea informațiilor din lumea reală pentru a crea noi programe și platforme. Datele sintetice ar putea oferi dezvoltatorilor o soluție alternativă pentru a înlocui datele extrem de sensibile.

    Implicațiile datelor sintetice 

    Implicațiile mai largi ale datelor sintetice pot include:

    • Dezvoltarea accelerată de noi sisteme AI, atât la scară, cât și la diversitate, care îmbunătățesc procesele din numeroase industrii și domenii de disciplină, ceea ce duce la o eficiență sporită în sectoare precum sănătatea, transportul și finanțele.
    • Permite organizațiilor să partajeze informații mai deschis și echipelor să colaboreze și să opereze mai eficient, ceea ce duce la un mediu de lucru mai coeziv și la capacitatea de a aborda proiecte complexe cu ușurință.
    • Dezvoltatorii și profesioniștii în date pot trimite prin e-mail sau transporta seturi mari de date sintetice pe laptop-urile lor, știind în siguranță că datele critice nu sunt puse în pericol, ceea ce duce la condiții de lucru mai flexibile și mai sigure.
    • Frecvența redusă a încălcărilor securității cibernetice a bazelor de date, deoarece datele autentice nu vor mai trebui accesate sau partajate la fel de des, ceea ce duce la un mediu digital mai sigur pentru companii și persoane deopotrivă.
    • Guvernele câștigă mai multă libertate de a implementa o legislație mai strictă de gestionare a datelor, fără a-și face griji cu privire la împiedicarea dezvoltării industriei a sistemelor AI, ceea ce duce la un peisaj de utilizare a datelor mai reglementat și mai transparent.
    • Potențialul ca datele sintetice să fie utilizate în mod neetic în crearea de deepfake sau alte medii manipulative, ceea ce duce la dezinformare și erodarea încrederii în conținutul digital.
    • O schimbare a dinamicii pieței muncii, cu o dependență crescută de datele sintetice care ar putea reduce nevoia de roluri de colectare a datelor, ceea ce duce la înlocuirea locurilor de muncă în anumite sectoare.
    • Impactul potențial asupra mediului al resurselor de calcul crescute necesare pentru generarea și gestionarea datelor sintetice, ceea ce duce la un consum mai mare de energie și preocupări legate de mediu.

    Întrebări de luat în considerare

    • Ce alte industrii ar putea beneficia de pe urma datelor sintetice?
    • Ce reglementări ar trebui să implementeze guvernul cu privire la modul în care sunt create, utilizate și implementate datele sintetice? 

    Referințe de perspectivă

    Următoarele linkuri populare și instituționale au fost menționate pentru această perspectivă: