Gervigreind: Samsvörun gervigreindarmarkmiða passar við mannleg gildi

MYNDAGREIÐSLA:
Image inneign
iStock

Gervigreind: Samsvörun gervigreindarmarkmiða passar við mannleg gildi

Gervigreind: Samsvörun gervigreindarmarkmiða passar við mannleg gildi

Texti undirfyrirsagna
Sumir vísindamenn telja að grípa eigi til aðgerða til að tryggja að gervigreind skaði ekki samfélagið.
    • Höfundur:
    • Höfundur nafn
      Quantumrun Foresight
    • 25. Janúar, 2023

    Gervigreind (AI) jöfnun er þegar markmið gervigreindarkerfis passa við mannleg gildi. Fyrirtæki eins og OpenAI, DeepMind og Anthropic eru með teymi vísindamanna sem einblína á að rannsaka handrið fyrir mismunandi aðstæður þar sem þetta gæti gerst.

    AI alignment samhengi

    Samkvæmt rannsókn frá háskólanum í Cornell árið 2021 hafa nokkrar rannsóknir sýnt að verkfæri eða líkön búin til með reiknirit sýna hlutdrægni sem fengin er úr gögnunum sem þeir voru þjálfaðir í. Til dæmis, í náttúrulegri málvinnslu (NLP), hafa valin NLP líkön sem þjálfuð eru á takmörkuðum gagnasöfnum verið skjalfest þar sem spár eru byggðar á skaðlegum staðalmyndum kynjanna gegn konum. Að sama skapi komust aðrar rannsóknir í ljós að reiknirit sem þjálfað var á gagnasetti sem átt hefur sér stað leiddu til ráðlegginga sem eru hlutdrægar vegna kynþátta, sérstaklega í löggæslu.

    Það eru fullt af dæmum þar sem vélanámskerfi hafa staðið sig verr fyrir minnihlutahópa eða hópa sem þjást af margvíslegum ókostum. Sérstaklega virka sjálfvirk andlitsgreining og heilsugæslugreiningar venjulega ekki mjög vel fyrir konur og litað fólk. Þegar mikilvæg kerfi sem ættu að byggjast á staðreyndum og rökfræði í stað tilfinninga eru notuð í samhengi eins og að úthluta heilbrigðisþjónustu eða menntun, geta þau valdið meiri skaða með því að gera það erfiðara að greina rökin á bak við þessar ráðleggingar.

    Fyrir vikið eru tæknifyrirtæki að búa til gervigreindarhópa til að einbeita sér að því að halda reikniritum sanngjörnum og mannúðlegum. Rannsóknir eru nauðsynlegar til að skilja stefnu háþróaðra gervigreindarkerfa, sem og áskoranirnar sem við gætum staðið frammi fyrir þegar gervigreindargeta vex.

    Truflandi áhrif

    Samkvæmt Jan Leike, yfirmanni gervigreindarjöfnunar hjá OpenAI (2021), í ljósi þess að gervigreindarkerfi hafa aðeins orðið fær á 2010, er skiljanlegt að flestar gervigreindarleitarrannsóknir hafi verið fræðilegar þungar. Þegar gífurlega öflug gervigreind kerfi eru samræmd er ein af áskorunum sem menn standa frammi fyrir að þessar vélar gætu búið til lausnir sem eru of flóknar til að endurskoða og meta hvort þær séu siðferðilega skynsamlegar.

    Leike útbjó endurkvæma verðlaunalíkön (RRM) stefnu til að laga þetta vandamál. Með RRM er nokkrum „hjálpar“ gervigreindum kennt til að hjálpa manni að meta hversu vel flóknari gervigreind stendur sig. Hann er bjartsýnn á möguleikann á að búa til eitthvað sem hann vísar til sem "alignment MVP." Í byrjunarskilmálum er MVP (eða lágmarks hagkvæm vara) einfaldasta mögulega vara sem fyrirtæki getur smíðað til að prófa hugmynd. Vonin er sú að einhvern tíma passi gervigreind mannlega frammistöðu í rannsóknum á gervigreind og samræmi þess við gildi á sama tíma og hún er virk.

    Þó að aukinn áhugi á gervigreindaraðlögun sé hreint jákvætt, halda margir sérfræðingar á þessu sviði að mikið af „siðfræði“ starfi á leiðandi gervigreindarstofum sé bara almannatengsl sem eru hönnuð til að láta tæknifyrirtæki líta vel út og forðast neikvæða umfjöllun. Þessir einstaklingar búast ekki við að siðferðileg þróunarvenjur verði forgangsverkefni þessara fyrirtækja í bráð.

    Þessar athuganir undirstrika mikilvægi þverfaglegra aðferða við aðlögun verðmæta, þar sem þetta er tiltölulega nýtt svið siðferðislegra og tæknilegra rannsókna. Mismunandi greinar þekkingar ættu að vera hluti af rannsóknaráætlun án aðgreiningar. Þetta framtak bendir einnig á nauðsyn þess að tæknifræðingar og stefnumótendur séu meðvitaðir um félagslegt samhengi sitt og hagsmunaaðila, jafnvel þegar gervigreindarkerfi verða fullkomnari.

    Afleiðingar gervigreindar

    Víðtækari afleiðingar gervigreindarstillingar geta falið í sér: 

    • Gervigreindarstofur ráða fjölbreyttar siðanefndir til að hafa umsjón með verkefnum og uppfylla siðferðilegar gervigreindarreglur. 
    • Ríkisstjórnir búa til lög sem krefjast þess að fyrirtæki leggi fram ábyrga gervigreindarramma sína og hvernig þau ætla að þróa gervigreindarverkefni sín frekar.
    • Auknar deilur um notkun reiknirita við ráðningar, opinbert eftirlit og löggæslu.
    • Vísindamenn reknir frá stórum gervigreindarstofum vegna hagsmunaárekstra milli siðferðis og markmiða fyrirtækja.
    • Meiri þrýstingur á stjórnvöld að setja reglur um háþróuð gervigreind kerfi sem eru bæði ótrúlega öflug en geta hugsanlega brotið mannréttindi.

    Spurningar til að tjá sig um

    • Hvernig er hægt að gera fyrirtæki ábyrg fyrir gervigreindarkerfum sem þau búa til?
    • Hverjar eru aðrar hugsanlegar hættur ef það er rangfærsla á gervigreind?