Quantumrun

KREDITU TAL-IMMAĠNI:

iStock

Dejta ta' taħriġ problematika: Meta l-AI tiġi mgħallma data preġudikata

Sistemi ta' intelliġenza artifiċjali kultant jiġu introdotti b'dejta suġġettiva li tista' taffettwa kif taġixxi u tieħu deċiżjonijiet.

awtur:
isem awtur
Quantumrun Foresight
Ottubru 14, 2022

Sommarju tal-għarfien

Aħna dak li nitgħallmu u ninternalizzaw; din id-ditta tapplika wkoll għall-intelliġenza artifiċjali (AI). Mudelli ta’ tagħlim bil-magni (ML) mitmugħa b’dejta mhux kompluta, preġudikata u mhux etika fl-aħħar mill-aħħar se jieħdu deċiżjonijiet u suġġerimenti problematiċi. Dawn l-algoritmi qawwija jistgħu mbagħad jinfluwenzaw il-moralità u l-perċezzjonijiet tal-utenti jekk ir-riċerkaturi ma joqogħdux attenti.

Kuntest tad-dejta tat-taħriġ problematiku

Sa mis-snin 2010, timijiet ta' riċerka ġew skrutinizzati talli użaw settijiet ta' dejta ta' taħriġ b'kontenut mhux adattat jew miġbura b'mod mhux etiku. Pereżempju, fl-2016, id-database MS-Celeb-1M ta 'Microsoft kienet tinkludi 10 miljun immaġini ta' 100,000 ċelebrità differenti. Madankollu, wara spezzjoni ulterjuri, korrispondenti skoprew li ħafna ritratti kienu ta 'nies komuni miġbuda minn diversi websajts mingħajr il-kunsens jew l-għarfien tas-sid.

Minkejja din ir-realizzazzjoni, is-sett tad-dejta kompla jiġi utilizzat minn kumpaniji ewlenin bħal Facebook u SenseTime, kumpanija Ċiniża ta’ rikonoxximent tal-wiċċ b’rabtiet mal-pulizija tal-istat. Bl-istess mod, sett ta’ dejta li fih stampi ta’ nies mexjin fuq il-kampus ta’ Duke University (DukeMTMC) lanqas ġabar il-kunsens. Eventwalment, iż-żewġ settijiet tad-dejta tneħħew.

Biex jenfasizzaw l-effetti ta 'ħsara ta' data ta 'taħriġ problematiku, riċerkaturi fil-Massachusetts Institute of Technology (MIT) ħolqu AI imsejħa Norman li huma għallmu biex iwettqu captioning tal-immaġni minn subreddit li enfasizzat il-vjolenza grafika. It-tim imbagħad poġġa lil Norman kontra netwerk newrali mħarreġ bl-użu ta 'dejta konvenzjonali. Ir-riċerkaturi fornew liż-żewġ sistemi b'inkblots Rorschach u talbu lill-AI biex jiddeskrivu dak li raw. Ir-riżultati kienu tal-isturdament: fejn in-netwerk newrali standard ra "ritratt iswed u abjad ta 'ingwanta tal-baseball," Norman osserva "raġel maqtul b'magna pistola fid-dawl tax-xemx." L-esperiment wera li l-AI mhix preġudikata awtomatikament, iżda dawk il-metodi ta 'dħul tad-dejta u l-motivi tal-ħallieqa tagħhom jistgħu jħallu impatt sinifikanti fuq l-imġieba ta' AI.

Impatt li jfixkel

Fl-2021, l-organizzazzjoni ta 'riċerka Allen Institute for AI ħolqot Ask Delphi, softwer ML li b'mod algoritmiku jiġġenera tweġibiet għal tweġibiet għal kwalunkwe mistoqsija etika. Ir-riċerkaturi wara l-proġett iddikjaraw li l-AI gradwalment qed issir aktar qawwija u familjari, għalhekk ix-xjenzati jeħtieġ li jgħallmu dawn l-etika tas-sistemi ML. Il-mudell Unicorn ML huwa l-pedament ta 'Delphi. Ġie fformulat biex iwettaq raġunament ta '"sens komun", bħall-għażla tat-tmiem l-aktar probabbli għal sekwenza ta' test.

Barra minn hekk, ir-riċerkaturi użaw il-'Commonsense Norm Bank.' Dan il-bank jikkonsisti f'1.7 miljun eżempju ta' evalwazzjonijiet etiċi tan-nies minn postijiet bħal Reddit. Bħala riżultat, l-output ta 'Delphi kien borża mħallta. Delphi wieġbet xi mistoqsijiet b'mod raġonevoli (eż., ugwaljanza bejn l-irġiel u n-nisa), filwaqt li, fuq xi suġġetti, Delphi kienet għal kollox offensiva (eż., il-ġenoċidju huwa aċċettabbli sakemm jagħmel lin-nies kuntenti).

Madankollu, id-Delphi AI qed titgħallem mill-esperjenzi tagħha u tidher li qed taġġorna t-tweġibiet tagħha bbażati fuq feedback. Xi esperti huma mnikkta bl-użu pubbliku u miftuħ tar-riċerka, meta wieħed iqis li l-mudell għadu għaddej u huwa suxxettibbli għal tweġibiet erratiċi. Meta ddebutta Ask Delphi, Mar Hicks, professur tal-Istorja f’Illinois Tech li jispeċjalizza fis-sess, ix-xogħol, u l-istorja tal-kompjuters, qalet li kien negliġenti tar-riċerkaturi li jistiednu lin-nies biex jużawh, meta wieħed iqis li Delphi immedjatament ipprovda tweġibiet estremament mhux etiċi u xi wħud. bla sens komplut.

Fl 2023, Bqija tad-Dinja wettaq studju dwar il-preġudizzju fil-ġeneraturi tal-immaġni AI. Bl-użu ta 'Midjourney, ir-riċerkaturi skoprew li l-immaġini ġġenerati jaffermaw sterjotipi eżistenti. Barra minn hekk, meta OpenAI applika filtri għad-dejta tat-taħriġ għall-mudell tal-ġenerazzjoni tal-immaġni DALL-E 2 tiegħu, intensifikat involontarjament il-preġudizzji relatati mas-sess.

Implikazzjonijiet ta 'dejta ta' taħriġ problematiku

Implikazzjonijiet usa' ta' data ta' taħriġ problematiku jistgħu jinkludu:

Preġudizzji msaħħa fi proġetti ta’ riċerka, servizzi, u żvilupp ta’ programmi. Dejta ta' taħriġ problematika hija partikolarment ta' tħassib jekk tintuża f'istituzzjonijiet tal-infurzar tal-liġi u bankarji (eż., immirati ħażin lejn gruppi minoritarji).
Żieda fl-investiment u l-iżvilupp fit-tkabbir u l-assortiment tad-dejta tat-taħriġ.
Aktar gvernijiet iżidu r-regolamenti biex jillimitaw kif il-korporazzjonijiet jiżviluppaw, ibigħu u jużaw id-dejta tat-taħriġ għal diversi inizjattivi kummerċjali.
Aktar negozji li jistabbilixxu dipartimenti tal-etika biex jiżguraw li proġetti mħaddma minn sistemi tal-IA jsegwu linji gwida etiċi.
Skrutinju mtejjeb dwar l-użu tal-AI fil-kura tas-saħħa li jwassal għal governanza tad-dejta aktar stretta, li tiżgura l-privatezza tal-pazjent u applikazzjoni etika tal-IA.
Żieda fil-kollaborazzjoni tas-settur pubbliku u privat biex jitrawwem il-litteriżmu fl-IA, billi tgħammar lill-forza tax-xogħol b'ħiliet għal futur iddominat mill-AI.
Żieda fid-domanda għal għodod ta’ trasparenza tal-IA, li twassal lill-kumpaniji biex jipprijoritizzaw l-ispjegabilità fis-sistemi tal-AI għall-fehim u l-fiduċja tal-konsumatur.