Erfið þjálfunargögn: Þegar gervigreind er kennd hlutdræg gögn

MYNDAGREIÐSLA:
Image inneign
iStock

Erfið þjálfunargögn: Þegar gervigreind er kennd hlutdræg gögn

Erfið þjálfunargögn: Þegar gervigreind er kennd hlutdræg gögn

Texti undirfyrirsagna
Gervigreindarkerfi eru stundum kynnt með huglægum gögnum sem geta haft áhrif á hvernig þau virka og taka ákvarðanir.
    • Höfundur:
    • Höfundur nafn
      Quantumrun Foresight
    • Október 14, 2022

    Innsýn samantekt

    Við erum það sem við lærum og innbyrðir; þessi tilmæli eiga einnig við um gervigreind (AI). Vélræn nám (ML) líkan sem eru fóðruð með ófullnægjandi, hlutdrægum og siðlausum gögnum munu að lokum taka erfiðar ákvarðanir og tillögur. Þessar öflugu reiknirit geta síðan haft áhrif á siðferði og skynjun notenda ef rannsakendur fara ekki varlega.

    Vandasamt þjálfunargagnasamhengi

    Síðan 2010 hefur rannsóknarteymi verið rannsakað fyrir að nota þjálfunargagnasöfn með óviðeigandi efni eða safnað á siðlausan hátt. Til dæmis, árið 2016, innihélt MS-Celeb-1M gagnagrunnur Microsoft 10 milljónir mynda af 100,000 mismunandi frægum. Við nánari skoðun komust bréfritarar hins vegar að því að margar myndir voru af venjulegu fólki teknar af ýmsum vefsíðum án samþykkis eða vitundar eigandans.

    Þrátt fyrir þessa áttun hélt gagnasafnið áfram að vera notað af stórfyrirtækjum eins og Facebook og SenseTime, kínversku andlitsþekkingarfyrirtæki með tengsl við ríkislögregluna. Á sama hátt safnaði gagnasafni sem innihélt myndir af fólki gangandi á háskólasvæði Duke háskólans (DukeMTMC) ekki samþykki heldur. Að lokum voru bæði gagnasöfnin fjarlægð. 

    Til að varpa ljósi á skaðleg áhrif erfiðra þjálfunargagna, bjuggu vísindamenn við Massachusetts Institute of Technology (MIT) til gervigreind sem heitir Norman sem þeir kenndu að framkvæma myndatexta frá subreddit sem benti á grafískt ofbeldi. Liðið setti Norman síðan gegn taugakerfi sem var þjálfað með hefðbundnum gögnum. Rannsakendur útveguðu bæði kerfin með Rorschach blekblettum og báðu gervigreindina að lýsa því sem þeir sáu. Niðurstöðurnar voru töfrandi: þar sem staðlaða taugakerfið sá „svört og hvíta mynd af hafnaboltahanska,“ sá Norman „mann myrtur með vélbyssu um hábjartan dag. Tilraunin sýndi að gervigreind er ekki sjálfkrafa hlutdræg, en þessar gagnainnsláttaraðferðir og hvatir höfunda þeirra geta haft veruleg áhrif á hegðun gervigreindar.

    Truflandi áhrif

    Árið 2021 stofnuðu rannsóknarstofnunin Allen Institute for AI Ask Delphi, ML hugbúnað sem reiknirit býr til svör fyrir svör við hvaða siðferðilegu spurningu sem er. Rannsakendur á bak við verkefnið sögðu að gervigreind væri smám saman að verða öflugri og kunnuglegri, svo vísindamenn þurfa að kenna þessi ML kerfi siðfræði. Unicorn ML líkanið er grunnurinn að Delphi. Það var mótað til að framkvæma "heilbrigða skynsemi" rökhugsun, eins og að velja líklegasta endann á textastreng. 

    Ennfremur notuðu vísindamenn „Commonsense Norm Bank“. Þessi banki samanstendur af 1.7 milljón dæmum um siðferðilegt mat fólks frá stöðum eins og Reddit. Fyrir vikið var framleiðsla Delphi með ólíkindum. Delphi svaraði sumum spurningum á sanngjarnan hátt (t.d. jafnrétti karla og kvenna), en í sumum efnum var Delphi beinlínis móðgandi (t.d. þjóðarmorð er ásættanlegt svo lengi sem það gerði fólk hamingjusamt).

    Hins vegar er Delphi AI að læra af reynslu sinni og virðist vera að uppfæra svör sín byggð á endurgjöf. Sumir sérfræðingar eru í vandræðum með almenna og opna notkun rannsóknarinnar, þar sem líkanið er í vinnslu og er viðkvæmt fyrir rangri svörum. Þegar Ask Delphi hóf frumraun sína sagði Mar Hicks, prófessor í sagnfræði við Illinois Tech sem sérhæfir sig í kyni, vinnu og sögu tölvunar, að það væri vanræksla af vísindamönnum að bjóða fólki að nota það, þar sem Delphi gaf strax afar siðlaus svör og sum algjört bull. 

    Í 2023, Rest of World gerði rannsókn á hlutdrægni í gervigreindarmyndavélum. Með því að nota Midjourney komust vísindamenn að því að myndirnar sem mynduðust staðfesta núverandi staðalmyndir. Þar að auki, þegar OpenAI beitti síum á þjálfunargögnin fyrir DALL-E 2 myndgerð líkansins, jók það óviljandi hlutdrægni sem tengist kyni.

    Afleiðingar erfiðra þjálfunargagna

    Víðtækari afleiðingar erfiðra þjálfunargagna geta verið: 

    • Aukin hlutdrægni í rannsóknarverkefnum, þjónustu og þróun forrita. Erfið þjálfunargögn snerta sérstaklega ef þau eru notuð í löggæslu- og bankastofnunum (t.d. beinast gegn minnihlutahópum).
    • Aukin fjárfesting og þróun í vexti og úrvali þjálfunargagna. 
    • Fleiri stjórnvöld auka reglur til að takmarka hvernig fyrirtæki þróa, selja og nota þjálfunargögn fyrir ýmis viðskiptaleg frumkvæði.
    • Fleiri fyrirtæki stofna siðfræðideildir til að tryggja að verkefni knúin af gervigreindarkerfum fylgi siðferðilegum leiðbeiningum.
    • Aukið eftirlit með notkun gervigreindar í heilbrigðisþjónustu sem leiðir til strangari gagnastjórnunar, sem tryggir friðhelgi sjúklinga og siðferðileg gervigreind umsókn.
    • Aukið samstarf hins opinbera og einkageirans til að efla læsi á gervigreind, útbúa vinnuafl með færni til framtíðar þar sem gervigreind er ráðandi.
    • Aukin eftirspurn eftir AI gagnsæisverkfærum, sem leiðir til þess að fyrirtæki forgangsraða útskýringum í gervigreindarkerfum fyrir skilning og traust neytenda.

    Spurningar sem þarf að íhuga

    • Hvernig gætu stofnanir forðast að nota erfið þjálfunargögn?
    • Hverjar eru aðrar hugsanlegar afleiðingar siðlausra þjálfunargagna?