L-allinjament tal-AI li jqabbel l-għanijiet tal-intelliġenza artifiċjali jaqblu mal-valuri umani

KREDITU TAL-IMMAĠNI:

iStock

Allinjament tal-AI: It-tqabbil tal-għanijiet tal-intelliġenza artifiċjali jaqbel mal-valuri umani

Xi riċerkaturi jemmnu li għandhom jiġu implimentati miżuri biex jiżguraw li l-intelliġenza artifiċjali ma tagħmilx ħsara lis-soċjetà.

awtur:
isem awtur
Quantumrun Foresight
Jannar 25, 2023

L-allinjament tal-intelliġenza artifiċjali (AI) huwa meta l-għanijiet ta' sistema AI jaqblu mal-valuri umani. Kumpaniji bħal OpenAI, DeepMind u Anthropic għandhom timijiet ta 'riċerkaturi li l-uniku fokus tagħhom huwa li jistudjaw guardrails għal xenarji differenti li fihom jista' jiġri dan.

Il-kuntest tal-allinjament tal-AI

Skont studju ta’ riċerka tal-Università ta’ Cornell tal-2021, bosta studji wrew li għodod jew mudelli maħluqa minn algoritmi juru preġudizzju li ġej mid-dejta li tħarrġu fuqha. Pereżempju, fl-ipproċessar tal-lingwa naturali (NLP), mudelli magħżula tal-NLP mħarrġa fuq settijiet ta’ dejta limitati ġew dokumentati li jagħmlu tbassir ibbażati fuq sterjotipi ta’ sessi ta’ ħsara kontra n-nisa. Bl-istess mod, studji oħra sabu li algoritmi mħarrġa fuq sett ta 'dejta mbagħbas irriżultaw f'rakkomandazzjonijiet preġudikati razzjalment, partikolarment fil-pulizija.

Hemm ħafna eżempji li fihom is-sistemi tat-tagħlim bil-magni għamlu agħar għall-minoranzi jew gruppi li jbatu minn żvantaġġi multipli. B'mod partikolari, l-analiżi awtomatizzata tal-wiċċ u d-dijanjostika tal-kura tas-saħħa tipikament ma jaħdmux tajjeb ħafna għan-nisa u n-nies ta 'kulur. Meta jintużaw sistemi kritiċi li għandhom ikunu bbażati fuq fatti u loġika minflok emozzjoni f'kuntesti bħall-allokazzjoni tal-kura tas-saħħa jew l-edukazzjoni, jistgħu jagħmlu aktar ħsara billi jagħmluha aktar diffiċli biex jiġi identifikat ir-raġunament wara dawn ir-rakkomandazzjonijiet.

Bħala riżultat, id-ditti tat-teknoloġija qed joħolqu timijiet ta 'allinjament tal-AI biex jiffokaw fuq iż-żamma tal-algoritmi ġusti u umani. Ir-riċerka hija essenzjali biex nifhmu d-direzzjoni tas-sistemi avvanzati tal-IA, kif ukoll l-isfidi li nistgħu niffaċċjaw hekk kif jikbru l-kapaċitajiet tal-IA.

Impatt li jfixkel

Skont Jan Leike, kap tal-allinjament tal-AI f'OpenAI (2021), peress li s-sistemi tal-AI saru kapaċi biss fis-snin 2010, wieħed jifhem li l-biċċa l-kbira tar-riċerka tal-allinjament tal-AI kienet teorija tqil. Meta sistemi AI qawwija immens ikunu allinjati, waħda mill-isfidi li jiffaċċjaw il-bnedmin hija li dawn il-magni jistgħu joħolqu soluzzjonijiet li huma kkumplikati wisq biex jiġu riveduti u vvalutati jekk jagħmlux sens etikament.

Leike fasslet strateġija ta 'mudellar ta' premju rikorsiv (RRM) biex tirranġa din il-problema. Bl-RRM, diversi AI "helper" huma mgħallma biex jgħinu lill-bniedem jevalwa kemm taħdem tajjeb AI aktar kumplessa. Huwa ottimist dwar il-possibbiltà li joħloq xi ħaġa li jirreferi għaliha bħala "MVP tal-allinjament." F'termini ta 'startup, MVP (jew prodott minimu vijabbli) huwa l-aktar prodott sempliċi possibbli li kumpanija tista' tibni biex tittestja idea. It-tama hija li xi darba, l-AI taqbel mal-prestazzjoni tal-bniedem fir-riċerka tal-AI u l-allinjament tagħha mal-valuri filwaqt li tkun funzjonali wkoll.

Filwaqt li ż-żieda fl-interess fl-allinjament tal-AI hija pożittiva netta, ħafna analisti fil-qasam jaħsbu li ħafna mix-xogħol tal-"etika" fil-laboratorji tal-AI ewlenin huwa biss relazzjonijiet pubbliċi maħsuba biex jagħmlu l-kumpaniji tat-teknoloġija jidhru tajbin u jevitaw pubbliċità negattiva. Dawn l-individwi ma jistennewx li l-prattiki ta' żvilupp etiku jsiru prijorità għal dawn il-kumpaniji dalwaqt.

Dawn l-osservazzjonijiet jenfasizzaw l-importanza ta 'approċċi interdixxiplinari għall-isforzi ta' allinjament tal-valur, peress li dan huwa qasam relattivament ġdid ta 'inkjesta morali u teknika. Fergħat differenti ta' għarfien għandhom ikunu parti minn aġenda ta' riċerka inklużiva. Din l-inizjattiva tindika wkoll il-ħtieġa li t-teknoloġisti u dawk li jfasslu l-politika jibqgħu konxji tal-kuntest soċjali tagħhom u l-partijiet interessati, anke meta s-sistemi tal-IA jsiru aktar avvanzati.

Implikazzjonijiet ta 'allinjament AI

Implikazzjonijiet usa' tal-allinjament tal-AI jistgħu jinkludu:

Laboratorji tal-intelliġenza artifiċjali jimpjegaw bordijiet tal-etika differenti biex jissorveljaw proġetti u jissodisfaw il-linji gwida etiċi tal-IA.
Gvernijiet li joħolqu liġijiet li jeħtieġu li l-kumpaniji jissottomettu l-qafas responsabbli tagħhom tal-AI u kif jippjanaw li jiżviluppaw aktar il-proġetti tagħhom tal-AI.
Żieda fil-kontroversji dwar l-użu tal-algoritmi fir-reklutaġġ, is-sorveljanza pubblika, u l-infurzar tal-liġi.
Riċerkaturi jitkeċċew minn laboratorji kbar tal-IA minħabba kunflitti ta’ interess bejn l-etika u l-għanijiet korporattivi.
Iktar pressjoni għall-gvernijiet biex jirregolaw sistemi avvanzati tal-IA li huma t-tnejn b'saħħithom oerhört iżda li potenzjalment jistgħu jiksru d-drittijiet tal-bniedem.