Quantumrun

IMAHE CREDIT:

iStock

Problema nga datos sa pagbansay: Kung ang AI gitudloan ug biased data

Ang mga sistema sa artipisyal nga paniktik usahay gipaila uban ang suhetibong datos nga makaapekto kung giunsa kini paglihok ug paghimog mga desisyon.

Author:
Ngalan sa tagsulat
Quantumrun Foresight
Oktubre 14, 2022

Katingbanan sa panabut

Kita ang atong nakat-unan ug gisulod; kini nga dictum magamit usab sa artificial intelligence (AI). Ang mga modelo sa pagkat-on sa makina (ML) nga gipakaon sa dili kompleto, mapihigon, ug dili etikal nga datos sa katapusan maghimo mga problema nga desisyon ug sugyot. Kining gamhanang mga algorithm mahimo unyang makaimpluwensya sa moralidad ug mga panglantaw sa mga tiggamit kon dili mag-amping ang mga tigdukiduki.

Problema nga konteksto sa datos sa pagbansay

Sukad sa 2010s, ang mga tim sa panukiduki gisusi alang sa paggamit sa mga set sa pagbansay nga adunay dili angay nga sulud o gitigum nga dili maayo. Pananglitan, sa 2016, ang database sa MS-Celeb-1M sa Microsoft naglakip sa 10 milyon nga mga imahe sa 100,000 nga lainlaing mga artista. Bisan pa, sa dugang nga pagsusi, nadiskobrehan sa mga tigbalita nga daghang mga litrato sa ordinaryong mga tawo nga gikuha gikan sa lainlaing mga website nga wala’y pagtugot o kahibalo sa tag-iya.

Bisan pa sa kini nga pagkaamgo, ang mga datos nagpadayon nga gigamit sa mga dagkong kompanya sama sa Facebook ug SenseTime, usa ka kompanya sa pag-ila sa nawong sa China nga adunay mga link sa pulisya sa estado. Sa parehas nga paagi, ang usa ka dataset nga adunay mga litrato sa mga tawo nga naglakaw sa campus sa Duke University (DukeMTMC) wala usab makakuha pagtugot. Sa katapusan, ang duha ka mga dataset gikuha.

Aron ipasiugda ang makadaot nga mga epekto sa problemado nga datos sa pagbansay, ang mga tigdukiduki sa Massachusetts Institute of Technology (MIT) naghimo sa usa ka AI nga gitawag og Norman nga ilang gitudloan sa paghimo sa mga captioning sa imahe gikan sa usa ka subreddit nga nagpasiugda sa graphic nga kapintasan. Gibutang dayon sa team si Norman batok sa usa ka neural network nga gibansay gamit ang naandan nga datos. Gihatagan sa mga tigdukiduki ang duha nga mga sistema sa Rorschach inkblots ug gihangyo ang mga AI nga ihulagway kung unsa ang ilang nakita. Talagsaon ang mga resulta: diin ang standard neural network nakakita sa "usa ka itom ug puti nga litrato sa usa ka gwantes sa baseball," naobserbahan ni Norman ang "usa ka tawo nga gipatay pinaagi sa machine gun sa hayag nga adlaw." Gipakita sa eksperimento nga ang AI dili awtomatik nga bias, apan ang mga pamaagi sa pag-input sa datos ug ang mga motibo sa ilang mga tiglalang mahimong makaapekto sa pamatasan sa usa ka AI.

Makasamok nga epekto

Kaniadtong 2021, ang organisasyon sa panukiduki nga Allen Institute alang sa AI nagmugna Pangutan-a ang Delphi, usa ka software sa ML nga algorithm nga naghimo mga tubag alang sa mga tubag sa bisan unsang pangutana nga pamatasan. Ang mga tigdukiduki sa luyo sa proyekto nag-ingon nga ang AI anam-anam nga nahimong labi ka kusgan ug pamilyar, busa kinahanglan nga itudlo sa mga siyentista kini nga mga pamatasan sa mga sistema sa ML. Ang modelo sa Unicorn ML mao ang pundasyon sa Delphi. Giporma kini aron ipatuman ang "common sense" nga pangatarungan, sama sa pagpili sa labing posible nga katapusan sa usa ka text string.

Dugang pa, gigamit sa mga tigdukiduki ang 'Commonsense Norm Bank.' Kini nga bangko naglangkob sa 1.7 milyon nga mga pananglitan sa mga etikal nga pagtimbang-timbang sa mga tawo gikan sa mga lugar sama sa Reddit. Ingon nga resulta, ang output ni Delphi usa ka mixed bag. Gitubag ni Delphi ang pipila ka mga pangutana nga makatarunganon (pananglitan, pagkaparehas tali sa mga lalaki ug babaye), samtang, sa pipila ka mga hilisgutan, ang Delphi labi ka makapasakit (pananglitan, ang genocide madawat basta kini makapalipay sa mga tawo).

Bisan pa, ang Delphi AI nakakat-on gikan sa mga kasinatian niini ug daw nag-update sa mga tubag niini base sa feedback. Ang ubang mga eksperto nabalaka sa publiko ug bukas nga paggamit sa panukiduki, nga gikonsiderar nga ang modelo nagpadayon ug dali nga adunay dili maayo nga mga tubag. Sa dihang nag-debut ang Ask Delphi, si Mar Hicks, usa ka propesor sa History sa Illinois Tech nga nag-espesyalisar sa gender, labor, ug sa kasaysayan sa pag-compute, miingon nga nagpabaya ang mga tigdukiduki sa pagdapit sa mga tawo sa paggamit niini, tungod kay ang Delphi diha-diha dayon naghatag ug hilabihan nga dili etikal nga mga tubag ug ang uban. bug-os nga walay pulos.

Sa 2023, Pahulay sa Kalibutan nagpahigayon usa ka pagtuon bahin sa bias sa AI image generators. Gamit ang Midjourney, nadiskobrehan sa mga tigdukiduki nga ang mga namugna nga mga imahe nagpamatuod nga adunay mga stereotypes. Dugang pa, kung ang OpenAI nag-apply sa mga pagsala sa datos sa pagbansay alang sa modelo sa paghimo sa imahe sa DALL-E 2, wala tuyoa nga gipakusog niini ang mga bias nga may kalabotan sa gender.

Mga implikasyon sa problemado nga datos sa pagbansay

Ang mas lapad nga mga implikasyon sa problemado nga datos sa pagbansay mahimong maglakip sa:

Gipalig-on nga mga bias sa mga proyekto sa panukiduki, serbisyo, ug pagpalambo sa programa. Ang problema nga datos sa pagbansay ilabi na kon gamiton sa pagpatuman sa balaod ug mga institusyon sa pagbabangko (pananglitan, dili maayo nga target nga mga grupo sa minoriya).
Dugang pamuhunan ug kalamboan sa pagtubo ug assortment sa pagbansay-bansay data.
Daghang mga gobyerno ang nagpadako sa mga regulasyon aron limitahan kung giunsa ang mga korporasyon sa pagpalambo, pagbaligya, ug paggamit sa datos sa pagbansay alang sa lainlaing mga komersyal nga inisyatibo.
Daghang mga negosyo nga nagtukod ug mga departamento sa pamatasan aron masiguro nga ang mga proyekto nga gipadagan sa mga sistema sa AI nagsunod sa mga panudlo sa pamatasan.
Gipauswag nga pagsusi sa paggamit sa AI sa pag-atiman sa kahimsog nga nanguna sa mas estrikto nga pagdumala sa datos, pagsiguro sa pagkapribado sa pasyente ug etikal nga aplikasyon sa AI.
Gidugangan ang kolaborasyon sa publiko ug pribado nga sektor aron mapalambo ang literasiya sa AI, nga nagsangkap sa mga trabahante sa mga kahanas alang sa umaabot nga gimandoan sa AI.
Pagtaas sa panginahanglan alang sa AI transparency tool, nanguna sa mga kompanya nga unahon ang pagpatin-aw sa mga sistema sa AI alang sa pagsabut ug pagsalig sa mga konsumedor.

Mga pangutana nga hunahunaon

Sa unsang paagi malikayan sa mga organisasyon ang paggamit sa problema nga datos sa pagbansay?
Unsa ang ubang mga potensyal nga sangputanan sa dili maayo nga datos sa pagbansay?

Idugang sa lista