Të dhëna sintetike: Krijimi i sistemeve të sakta të AI duke përdorur modele të prodhuara

KREDI I IMAZHIT:
Kredia Image
iStock

Të dhëna sintetike: Krijimi i sistemeve të sakta të AI duke përdorur modele të prodhuara

Të dhëna sintetike: Krijimi i sistemeve të sakta të AI duke përdorur modele të prodhuara

Teksti i nëntitullit
Për të krijuar modele të sakta të inteligjencës artificiale (AI), të dhënat e simuluara të krijuara nga një algoritëm po shohin dobi të shtuar.
    • Author:
    • Emri i autorit
      Parashikimi Kuantumrun
    • Mund 4, 2022

    Përmbledhje e pasqyrës

    Të dhënat sintetike, një mjet i fuqishëm që ka aplikacione që variojnë nga kujdesi shëndetësor deri tek shitja me pakicë, po riformësojnë mënyrën se si zhvillohen dhe zbatohen sistemet e AI. Duke mundësuar krijimin e grupeve të të dhënave të larmishme dhe komplekse pa rrezikuar informacionin e ndjeshëm, të dhënat sintetike po rrisin efikasitetin në të gjithë industritë, duke ruajtur privatësinë dhe duke reduktuar kostot. Megjithatë, ai gjithashtu paraqet sfida, të tilla si keqpërdorimi i mundshëm në krijimin e mediave mashtruese, shqetësimet mjedisore që lidhen me konsumin e energjisë dhe ndryshimet në dinamikat e tregut të punës që duhet të menaxhohen me kujdes.

    Konteksti i të dhënave sintetike

    Për dekada të tëra, të dhënat sintetike kanë ekzistuar në forma të ndryshme. Mund të gjendet në lojërat kompjuterike si simulatorët e fluturimit dhe në simulimet e fizikës që përshkruajnë gjithçka nga atomet tek galaktikat. Tani, të dhënat sintetike po aplikohen brenda industrive të tilla si kujdesi shëndetësor për të zgjidhur sfidat e botës reale të AI.

    Përparimi i AI vazhdon të hasë në disa pengesa në zbatim. Grupe të mëdha të dhënash, për shembull, kërkohen për të dhënë gjetje të besueshme, pa paragjykime dhe për t'iu përmbajtur rregullave gjithnjë e më të rrepta të privatësisë së të dhënave. Mes këtyre sfidave, të dhënat e shënuara të krijuara nga simulimet ose programet e kompjuterizuara janë shfaqur si një alternativë ndaj të dhënave origjinale. Këto të dhëna të krijuara nga AI, të njohura si të dhëna sintetike, janë kritike për zgjidhjen e shqetësimeve të privatësisë dhe zhdukjen e paragjykimeve pasi mund të garantojnë diversitet të dhënash që pasqyrojnë botën aktuale.

    Praktikuesit e kujdesit shëndetësor përdorin të dhëna sintetike, si shembull, brenda sektorit të imazheve mjekësore për të trajnuar sistemet e AI duke ruajtur konfidencialitetin e pacientit. Firma e kujdesit virtual, Curai, për shembull, përdori 400,000 raste mjekësore sintetike për të trajnuar një algoritëm diagnostikimi. Për më tepër, shitës me pakicë si Caper përdorin simulime 3D për të krijuar një grup të dhënash sintetike prej një mijë fotografish nga vetëm pesë shkrepje produkti. Sipas një studimi të Gartner të publikuar në qershor 2021, i fokusuar në të dhënat sintetike, shumica e të dhënave të përdorura në zhvillimin e AI do të prodhohen artificialisht nga legjislacioni, standardet statistikore, simulimet ose mjete të tjera deri në vitin 2030.

    Ndikim shkatërrues

    Të dhënat sintetike ndihmojnë në ruajtjen e privatësisë dhe parandalimin e shkeljeve të të dhënave. Për shembull, një spital ose korporatë mund t'i ofrojë një zhvilluesi të dhëna mjekësore sintetike me cilësi të lartë për të trajnuar një sistem diagnostikimi të kancerit të bazuar në AI - të dhëna që janë po aq komplekse sa të dhënat e botës reale që ky sistem synon të interpretojë. Në këtë mënyrë, zhvilluesit kanë grupe të dhënash cilësore për t'u përdorur gjatë dizajnimit dhe përpilimit të sistemit, dhe rrjeti spitalor nuk rrezikon të rrezikojë të dhënat mjekësore të ndjeshme dhe të pacientit. 

    Të dhënat sintetike mund të lejojnë më tej blerësit e të dhënave të testimit të aksesojnë informacionin me një çmim më të ulët se shërbimet tradicionale. Sipas Paul Walborsky, i cili bashkëthemeloi AI Reverie, një nga bizneset e para të dedikuara të të dhënave sintetike, një imazh i vetëm që kushton 6 dollarë nga një shërbim etiketimi mund të gjenerohet artificialisht për gjashtë cent. Anasjelltas, të dhënat sintetike do të hapin rrugën për të dhëna të shtuara, që përfshin shtimin e të dhënave të reja në një grup të dhënash ekzistuese të botës reale. Zhvilluesit mund të rrotullojnë ose ndriçojnë një imazh të vjetër për të krijuar një të ri. 

    Së fundi, duke pasur parasysh shqetësimet e privatësisë dhe kufizimet e qeverisë, informacioni personal që ekziston në një bazë të dhënash po bëhet gjithnjë e më i ligjshëm dhe kompleks, duke e bërë më të vështirë përdorimin e informacionit të botës reale për të krijuar programe dhe platforma të reja. Të dhënat sintetike mund t'u ofrojnë zhvilluesve një zgjidhje për të zëvendësuar të dhënat shumë të ndjeshme.

    Implikimet e të dhënave sintetike 

    Implikimet më të gjera të të dhënave sintetike mund të përfshijnë:

    • Zhvillimi i përshpejtuar i sistemeve të reja të AI, si në shkallë ashtu edhe në diversitet, që përmirësojnë proceset në industri dhe fusha të shumta të disiplinës, duke çuar në rritjen e efikasitetit në sektorë si kujdesi shëndetësor, transporti dhe financa.
    • Mundësimi i organizatave për të ndarë informacionin më hapur dhe ekipet për të bashkëpunuar dhe për të vepruar në mënyrë më efikase, duke çuar në një mjedis pune më koheziv dhe aftësi për të trajtuar me lehtësi projekte komplekse.
    • Zhvilluesit dhe profesionistët e të dhënave duke qenë në gjendje të dërgojnë email ose të mbajnë grupe të mëdha të dhënash sintetike në laptopët e tyre, të sigurt duke ditur që të dhënat kritike nuk po rrezikohen, gjë që çon në kushte më fleksibël dhe më të sigurta të punës.
    • Frekuenca e reduktuar e shkeljeve të sigurisë kibernetike të bazës së të dhënave, pasi të dhënat autentike nuk do të kenë më nevojë të aksesohen ose të ndahen aq shpesh, duke çuar në një mjedis dixhital më të sigurt për bizneset dhe individët.
    • Qeveritë fitojnë më shumë liri për të zbatuar legjislacionin më të rreptë të menaxhimit të të dhënave pa u shqetësuar për pengimin e zhvillimit të industrisë së sistemeve të AI, duke çuar në një peizazh më të rregulluar dhe transparent të përdorimit të të dhënave.
    • Potenciali që të dhënat sintetike të përdoren në mënyrë joetike në krijimin e “deepfakes” ose mediave të tjera manipuluese, duke çuar në keqinformim dhe gërryerje të besimit në përmbajtjen dixhitale.
    • Një ndryshim në dinamikën e tregut të punës, me rritjen e mbështetjes në të dhënat sintetike, duke reduktuar potencialisht nevojën për role të mbledhjes së të dhënave, duke çuar në zhvendosje të vendeve të punës në sektorë të caktuar.
    • Ndikimi i mundshëm mjedisor i rritjes së burimeve llogaritëse të nevojshme për të gjeneruar dhe menaxhuar të dhëna sintetike, duke çuar në konsum më të lartë të energjisë dhe shqetësime mjedisore të lidhura.

    Pyetje që duhen marrë parasysh

    • Cilat industri të tjera mund të përfitojnë nga të dhënat sintetike?
    • Çfarë rregulloresh duhet të zbatojë qeveria në lidhje me mënyrën se si krijohen, përdoren dhe shpërndahen të dhënat sintetike? 

    Referencat e njohurive

    Lidhjet e mëposhtme popullore dhe institucionale u referuan për këtë pasqyrë: