Data synthetig: Creu systemau AI cywir gan ddefnyddio modelau gweithgynhyrchu

CREDYD DELWEDD:
Credyd Delwedd
iStock

Data synthetig: Creu systemau AI cywir gan ddefnyddio modelau gweithgynhyrchu

Data synthetig: Creu systemau AI cywir gan ddefnyddio modelau gweithgynhyrchu

Testun is-bennawd
Er mwyn creu modelau deallusrwydd artiffisial (AI) cywir, mae data efelychiedig a grëwyd gan algorithm yn gweld mwy o ddefnydd.
    • Awdur:
    • enw awdur
      Rhagolwg Quantumrun
    • Efallai y 4, 2022

    Crynodeb mewnwelediad

    Mae data synthetig, offeryn pwerus sydd â chymwysiadau sy'n amrywio o ofal iechyd i fanwerthu, yn ail-lunio'r ffordd y mae systemau AI yn cael eu datblygu a'u gweithredu. Trwy alluogi creu setiau data amrywiol a chymhleth heb beryglu gwybodaeth sensitif, mae data synthetig yn gwella effeithlonrwydd ar draws diwydiannau, yn cadw preifatrwydd, ac yn lleihau costau. Fodd bynnag, mae hefyd yn cyflwyno heriau, megis camddefnydd posibl wrth greu cyfryngau twyllodrus, pryderon amgylcheddol sy'n ymwneud â'r defnydd o ynni, a newidiadau yn neinameg y farchnad lafur y mae angen eu rheoli'n ofalus.

    Cyd-destun data synthetig

    Ers degawdau, mae data synthetig wedi bodoli mewn gwahanol ffurfiau. Gellir dod o hyd iddo mewn gemau cyfrifiadurol fel efelychwyr hedfan ac mewn efelychiadau ffiseg sy'n darlunio popeth o atomau i alaethau. Nawr, mae data synthetig yn cael ei gymhwyso o fewn diwydiannau fel gofal iechyd i ddatrys heriau AI yn y byd go iawn.

    Mae datblygiad deallusrwydd artiffisial yn parhau i wynebu sawl rhwystr gweithredu. Mae angen setiau data mawr, er enghraifft, i sicrhau canfyddiadau dibynadwy, bod yn rhydd o ragfarn, a chadw at reoliadau preifatrwydd data cynyddol llymach. Ynghanol yr heriau hyn, mae data anodedig a grëwyd gan efelychiadau neu raglenni cyfrifiadurol wedi dod i'r amlwg fel dewis amgen i ddata dilys. Mae'r data hwn a grëwyd gan AI, a elwir yn ddata synthetig, yn hanfodol i ddatrys pryderon preifatrwydd a dileu rhagfarn gan y gall sicrhau amrywiaeth data sy'n adlewyrchu'r byd go iawn.

    Mae ymarferwyr gofal iechyd yn defnyddio data synthetig, fel enghraifft, yn y sector delweddau meddygol i hyfforddi systemau AI wrth gynnal cyfrinachedd cleifion. Defnyddiodd y cwmni gofal rhithwir, Curai, er enghraifft, 400,000 o achosion meddygol synthetig i hyfforddi algorithm diagnosis. At hynny, mae manwerthwyr fel Caper yn defnyddio efelychiadau 3D i greu set ddata synthetig o fil o ffotograffau o gyn lleied â phum llun cynnyrch. Yn ôl astudiaeth Gartner a ryddhawyd ym mis Mehefin 2021 a oedd yn canolbwyntio ar ddata synthetig, bydd y rhan fwyaf o'r data a ddefnyddir mewn datblygu AI yn cael ei gynhyrchu'n artiffisial gan ddeddfwriaeth, safonau ystadegol, efelychiadau, neu ddulliau eraill erbyn 2030.

    Effaith aflonyddgar

    Mae data synthetig yn helpu i gadw preifatrwydd ac atal achosion o dorri data. Er enghraifft, gall ysbyty neu gorfforaeth gynnig data meddygol synthetig o ansawdd uchel i ddatblygwr i hyfforddi system diagnosis canser yn seiliedig ar AI - data sydd mor gymhleth â data'r byd go iawn y mae'r system hon i fod i'w ddehongli. Yn y modd hwn, mae gan y datblygwyr setiau data o ansawdd i'w defnyddio wrth ddylunio a llunio'r system, ac nid yw'r rhwydwaith ysbytai mewn perygl o beryglu data meddygol sensitif, cleifion. 

    Gall data synthetig hefyd ganiatáu i brynwyr data profi gael mynediad at wybodaeth am bris is na gwasanaethau traddodiadol. Yn ôl Paul Walborsky, a gyd-sefydlodd AI Reverie, un o'r busnesau data synthetig pwrpasol cyntaf, gellir cynhyrchu delwedd sengl sy'n costio $6 o wasanaeth labelu yn artiffisial am chwe sent. I'r gwrthwyneb, bydd data synthetig yn paratoi'r ffordd ar gyfer data estynedig, sy'n golygu ychwanegu data newydd at set ddata byd go iawn sy'n bodoli eisoes. Gallai datblygwyr gylchdroi neu fywiogi hen ddelwedd i wneud un newydd. 

    Yn olaf, o ystyried pryderon preifatrwydd a chyfyngiadau'r llywodraeth, mae gwybodaeth bersonol sy'n bodoli mewn cronfa ddata yn dod yn fwyfwy deddfwriaethol a chymhleth, gan ei gwneud yn anoddach i wybodaeth byd go iawn gael ei defnyddio i greu rhaglenni a llwyfannau newydd. Gallai data synthetig roi ateb i ddatblygwyr i gymryd lle data sensitif iawn.

    Goblygiadau data synthetig 

    Gall goblygiadau ehangach data synthetig gynnwys:

    • Datblygiad carlam systemau AI newydd, o ran graddfa ac amrywiaeth, sy'n gwella prosesau mewn nifer o ddiwydiannau a meysydd disgyblaeth, gan arwain at well effeithlonrwydd mewn sectorau fel gofal iechyd, cludiant a chyllid.
    • Galluogi sefydliadau i rannu gwybodaeth yn fwy agored a thimau i gydweithio a gweithredu’n fwy effeithlon, gan arwain at amgylchedd gwaith mwy cydlynol a’r gallu i fynd i’r afael â phrosiectau cymhleth yn rhwydd.
    • Datblygwyr a gweithwyr data proffesiynol yn gallu e-bostio neu gario setiau data synthetig mawr ar eu gliniaduron, yn ddiogel o wybod nad yw data hanfodol yn cael ei beryglu, gan arwain at amodau gwaith mwy hyblyg a diogel.
    • Amlder is o achosion o dorri seiberddiogelwch cronfa ddata, gan na fydd angen i ddata dilys gael ei gyrchu na’i rannu mor aml mwyach, gan arwain at amgylchedd digidol mwy diogel i fusnesau ac unigolion fel ei gilydd.
    • Llywodraethau yn ennill mwy o ryddid i weithredu deddfwriaeth rheoli data llymach heb boeni am rwystro datblygiad systemau AI yn y diwydiant, gan arwain at dirwedd defnydd data mwy rheoledig a thryloyw.
    • Y potensial i ddata synthetig gael ei ddefnyddio’n anfoesegol i greu ffugiau dwfn neu gyfryngau ystrywgar eraill, gan arwain at wybodaeth anghywir ac erydu ymddiriedaeth mewn cynnwys digidol.
    • Newid yn neinameg y farchnad lafur, gyda mwy o ddibyniaeth ar ddata synthetig o bosibl yn lleihau'r angen am rolau casglu data, gan arwain at ddadleoli swyddi mewn rhai sectorau.
    • Effaith amgylcheddol bosibl y cynnydd mewn adnoddau cyfrifiadurol sydd eu hangen i gynhyrchu a rheoli data synthetig, gan arwain at ddefnydd uwch o ynni a phryderon amgylcheddol cysylltiedig.

    Cwestiynau i'w hystyried

    • Pa ddiwydiannau eraill a allai elwa o ddata synthetig?
    • Pa reoliadau y dylai'r llywodraeth eu gweithredu ynghylch sut mae data synthetig yn cael ei greu, ei ddefnyddio a'i ddefnyddio? 

    Cyfeiriadau mewnwelediad

    Cyfeiriwyd at y cysylltiadau poblogaidd a sefydliadol canlynol ar gyfer y mewnwelediad hwn: