Dejta ta' taħriġ problematika: Meta l-AI tiġi mgħallma data preġudikata

KREDITU TAL-IMMAĠNI:
Immaġni kreditu
iStock

Dejta ta' taħriġ problematika: Meta l-AI tiġi mgħallma data preġudikata

Dejta ta' taħriġ problematika: Meta l-AI tiġi mgħallma data preġudikata

Test tas-subintestatura
Sistemi ta' intelliġenza artifiċjali kultant jiġu introdotti b'dejta suġġettiva li tista' taffettwa kif taġixxi u tieħu deċiżjonijiet.
    • awtur:
    • isem awtur
      Quantumrun Foresight
    • Ottubru 14, 2022

    Sommarju tal-għarfien

    Aħna dak li nitgħallmu u ninternalizzaw; din id-ditta tapplika wkoll għall-intelliġenza artifiċjali (AI). Mudelli ta’ tagħlim bil-magni (ML) mitmugħa b’dejta mhux kompluta, preġudikata u mhux etika fl-aħħar mill-aħħar se jieħdu deċiżjonijiet u suġġerimenti problematiċi. Dawn l-algoritmi qawwija jistgħu mbagħad jinfluwenzaw il-moralità u l-perċezzjonijiet tal-utenti jekk ir-riċerkaturi ma joqogħdux attenti.

    Kuntest tad-dejta tat-taħriġ problematiku

    Sa mis-snin 2010, timijiet ta' riċerka ġew skrutinizzati talli użaw settijiet ta' dejta ta' taħriġ b'kontenut mhux adattat jew miġbura b'mod mhux etiku. Pereżempju, fl-2016, id-database MS-Celeb-1M ta 'Microsoft kienet tinkludi 10 miljun immaġini ta' 100,000 ċelebrità differenti. Madankollu, wara spezzjoni ulterjuri, korrispondenti skoprew li ħafna ritratti kienu ta 'nies komuni miġbuda minn diversi websajts mingħajr il-kunsens jew l-għarfien tas-sid.

    Minkejja din ir-realizzazzjoni, is-sett tad-dejta kompla jiġi utilizzat minn kumpaniji ewlenin bħal Facebook u SenseTime, kumpanija Ċiniża ta’ rikonoxximent tal-wiċċ b’rabtiet mal-pulizija tal-istat. Bl-istess mod, sett ta’ dejta li fih stampi ta’ nies mexjin fuq il-kampus ta’ Duke University (DukeMTMC) lanqas ġabar il-kunsens. Eventwalment, iż-żewġ settijiet tad-dejta tneħħew. 

    Biex jenfasizzaw l-effetti ta 'ħsara ta' data ta 'taħriġ problematiku, riċerkaturi fil-Massachusetts Institute of Technology (MIT) ħolqu AI imsejħa Norman li huma għallmu biex iwettqu captioning tal-immaġni minn subreddit li enfasizzat il-vjolenza grafika. It-tim imbagħad poġġa lil Norman kontra netwerk newrali mħarreġ bl-użu ta 'dejta konvenzjonali. Ir-riċerkaturi fornew liż-żewġ sistemi b'inkblots Rorschach u talbu lill-AI biex jiddeskrivu dak li raw. Ir-riżultati kienu tal-isturdament: fejn in-netwerk newrali standard ra "ritratt iswed u abjad ta 'ingwanta tal-baseball," Norman osserva "raġel maqtul b'magna pistola fid-dawl tax-xemx." L-esperiment wera li l-AI mhix preġudikata awtomatikament, iżda dawk il-metodi ta 'dħul tad-dejta u l-motivi tal-ħallieqa tagħhom jistgħu jħallu impatt sinifikanti fuq l-imġieba ta' AI.

    Impatt li jfixkel

    Fl-2021, l-organizzazzjoni ta 'riċerka Allen Institute for AI ħolqot Ask Delphi, softwer ML li b'mod algoritmiku jiġġenera tweġibiet għal tweġibiet għal kwalunkwe mistoqsija etika. Ir-riċerkaturi wara l-proġett iddikjaraw li l-AI gradwalment qed issir aktar qawwija u familjari, għalhekk ix-xjenzati jeħtieġ li jgħallmu dawn l-etika tas-sistemi ML. Il-mudell Unicorn ML huwa l-pedament ta 'Delphi. Ġie fformulat biex iwettaq raġunament ta '"sens komun", bħall-għażla tat-tmiem l-aktar probabbli għal sekwenza ta' test. 

    Barra minn hekk, ir-riċerkaturi użaw il-'Commonsense Norm Bank.' Dan il-bank jikkonsisti f'1.7 miljun eżempju ta' evalwazzjonijiet etiċi tan-nies minn postijiet bħal Reddit. Bħala riżultat, l-output ta 'Delphi kien borża mħallta. Delphi wieġbet xi mistoqsijiet b'mod raġonevoli (eż., ugwaljanza bejn l-irġiel u n-nisa), filwaqt li, fuq xi suġġetti, Delphi kienet għal kollox offensiva (eż., il-ġenoċidju huwa aċċettabbli sakemm jagħmel lin-nies kuntenti).

    Madankollu, id-Delphi AI qed titgħallem mill-esperjenzi tagħha u tidher li qed taġġorna t-tweġibiet tagħha bbażati fuq feedback. Xi esperti huma mnikkta bl-użu pubbliku u miftuħ tar-riċerka, meta wieħed iqis li l-mudell għadu għaddej u huwa suxxettibbli għal tweġibiet erratiċi. Meta ddebutta Ask Delphi, Mar Hicks, professur tal-Istorja f’Illinois Tech li jispeċjalizza fis-sess, ix-xogħol, u l-istorja tal-kompjuters, qalet li kien negliġenti tar-riċerkaturi li jistiednu lin-nies biex jużawh, meta wieħed iqis li Delphi immedjatament ipprovda tweġibiet estremament mhux etiċi u xi wħud. bla sens komplut. 

    Fl 2023, Bqija tad-Dinja wettaq studju dwar il-preġudizzju fil-ġeneraturi tal-immaġni AI. Bl-użu ta 'Midjourney, ir-riċerkaturi skoprew li l-immaġini ġġenerati jaffermaw sterjotipi eżistenti. Barra minn hekk, meta OpenAI applika filtri għad-dejta tat-taħriġ għall-mudell tal-ġenerazzjoni tal-immaġni DALL-E 2 tiegħu, intensifikat involontarjament il-preġudizzji relatati mas-sess.

    Implikazzjonijiet ta 'dejta ta' taħriġ problematiku

    Implikazzjonijiet usa' ta' data ta' taħriġ problematiku jistgħu jinkludu: 

    • Preġudizzji msaħħa fi proġetti ta’ riċerka, servizzi, u żvilupp ta’ programmi. Dejta ta' taħriġ problematika hija partikolarment ta' tħassib jekk tintuża f'istituzzjonijiet tal-infurzar tal-liġi u bankarji (eż., immirati ħażin lejn gruppi minoritarji).
    • Żieda fl-investiment u l-iżvilupp fit-tkabbir u l-assortiment tad-dejta tat-taħriġ. 
    • Aktar gvernijiet iżidu r-regolamenti biex jillimitaw kif il-korporazzjonijiet jiżviluppaw, ibigħu u jużaw id-dejta tat-taħriġ għal diversi inizjattivi kummerċjali.
    • Aktar negozji li jistabbilixxu dipartimenti tal-etika biex jiżguraw li proġetti mħaddma minn sistemi tal-IA jsegwu linji gwida etiċi.
    • Skrutinju mtejjeb dwar l-użu tal-AI fil-kura tas-saħħa li jwassal għal governanza tad-dejta aktar stretta, li tiżgura l-privatezza tal-pazjent u applikazzjoni etika tal-IA.
    • Żieda fil-kollaborazzjoni tas-settur pubbliku u privat biex jitrawwem il-litteriżmu fl-IA, billi tgħammar lill-forza tax-xogħol b'ħiliet għal futur iddominat mill-AI.
    • Żieda fid-domanda għal għodod ta’ trasparenza tal-IA, li twassal lill-kumpaniji biex jipprijoritizzaw l-ispjegabilità fis-sistemi tal-AI għall-fehim u l-fiduċja tal-konsumatur.

    Mistoqsijiet li għandek tikkunsidra

    • L-organizzazzjonijiet kif jistgħu jevitaw li jużaw data ta' taħriġ problematika?
    • X'inhuma konsegwenzi potenzjali oħra ta' data ta' taħriġ mhux etiku?