പ്രശ്നകരമായ പരിശീലന ഡാറ്റ: AI-യെ പക്ഷപാതപരമായ ഡാറ്റ പഠിപ്പിക്കുമ്പോൾ

ഇമേജ് ക്രെഡിറ്റ്:
ഇമേജ് ക്രെഡിറ്റ്
iStock

പ്രശ്നകരമായ പരിശീലന ഡാറ്റ: AI-യെ പക്ഷപാതപരമായ ഡാറ്റ പഠിപ്പിക്കുമ്പോൾ

പ്രശ്നകരമായ പരിശീലന ഡാറ്റ: AI-യെ പക്ഷപാതപരമായ ഡാറ്റ പഠിപ്പിക്കുമ്പോൾ

ഉപശീർഷക വാചകം
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സംവിധാനങ്ങൾ ചിലപ്പോൾ ആത്മനിഷ്ഠമായ ഡാറ്റ ഉപയോഗിച്ച് അവതരിപ്പിക്കപ്പെടുന്നു, അത് എങ്ങനെ പ്രവർത്തിക്കുന്നു, തീരുമാനങ്ങൾ എടുക്കുന്നു.
    • രചയിതാവ്:
    • രചയിതാവിന്റെ പേര്
      Quantumrun ദീർഘവീക്ഷണം
    • ഒക്ടോബർ 14, 2022

    ഇൻസൈറ്റ് സംഗ്രഹം

    നമ്മൾ പഠിക്കുന്നതും ആന്തരികമാക്കുന്നതും നമ്മളാണ്; ഈ നിർദ്ദേശം ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിനും (AI) ബാധകമാണ്. മെഷീൻ ലേണിംഗ് (ML) മോഡലുകൾ അപൂർണ്ണവും പക്ഷപാതപരവും അധാർമ്മികവുമായ ഡാറ്റ ഉപയോഗിച്ച് ആത്യന്തികമായി പ്രശ്നകരമായ തീരുമാനങ്ങളും നിർദ്ദേശങ്ങളും ഉണ്ടാക്കും. ഗവേഷകർ ശ്രദ്ധിച്ചില്ലെങ്കിൽ ഈ ശക്തമായ അൽഗോരിതങ്ങൾ ഉപയോക്താക്കളുടെ ധാർമ്മികതയെയും ധാരണകളെയും സ്വാധീനിച്ചേക്കാം.

    പ്രശ്നകരമായ പരിശീലന ഡാറ്റ സന്ദർഭം

    2010-കൾ മുതൽ, അനുയോജ്യമല്ലാത്ത ഉള്ളടക്കമുള്ള അല്ലെങ്കിൽ അധാർമ്മികമായി ശേഖരിച്ച പരിശീലന ഡാറ്റാസെറ്റുകൾ ഉപയോഗിച്ചതിന് ഗവേഷണ ടീമുകളെ സൂക്ഷ്മമായി പരിശോധിക്കുന്നു. ഉദാഹരണത്തിന്, 2016-ൽ, മൈക്രോസോഫ്റ്റിന്റെ MS-Celeb-1M ഡാറ്റാബേസിൽ 10 വ്യത്യസ്ത സെലിബ്രിറ്റികളുടെ 100,000 ദശലക്ഷം ചിത്രങ്ങൾ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. എന്നിരുന്നാലും, കൂടുതൽ പരിശോധനയിൽ, നിരവധി ഫോട്ടോകൾ ഉടമയുടെ സമ്മതമോ അറിവോ കൂടാതെ വിവിധ വെബ്‌സൈറ്റുകളിൽ നിന്ന് വലിച്ചെടുത്ത സാധാരണക്കാരുടെ ഫോട്ടോകളാണെന്ന് ലേഖകർ കണ്ടെത്തി.

    ഈ തിരിച്ചറിവുണ്ടായിട്ടും, സംസ്ഥാന പോലീസുമായി ലിങ്കുകളുള്ള ചൈനീസ് മുഖം തിരിച്ചറിയൽ കമ്പനിയായ Facebook, SenseTime തുടങ്ങിയ പ്രമുഖ കമ്പനികൾ ഡാറ്റാസെറ്റ് ഉപയോഗിക്കുന്നത് തുടർന്നു. അതുപോലെ, ഡ്യൂക്ക് യൂണിവേഴ്സിറ്റിയുടെ കാമ്പസിൽ (ഡ്യൂക്ക്എംടിഎംസി) നടക്കുന്ന ആളുകളുടെ ചിത്രങ്ങൾ അടങ്ങിയ ഒരു ഡാറ്റാസെറ്റും സമ്മതം ശേഖരിച്ചില്ല. ഒടുവിൽ, രണ്ട് ഡാറ്റാസെറ്റുകളും നീക്കം ചെയ്തു. 

    പ്രശ്‌നകരമായ പരിശീലന ഡാറ്റയുടെ ദോഷകരമായ ഫലങ്ങൾ എടുത്തുകാണിക്കാൻ, മസാച്യുസെറ്റ്‌സ് ഇൻസ്റ്റിറ്റ്യൂട്ട് ഓഫ് ടെക്‌നോളജിയിലെ (എംഐടി) ഗവേഷകർ നോർമൻ എന്ന പേരിൽ ഒരു AI സൃഷ്ടിച്ചു, അത് ഗ്രാഫിക് അക്രമം ഉയർത്തിക്കാട്ടുന്ന സബ്‌റെഡിറ്റിൽ നിന്ന് ഇമേജ് അടിക്കുറിപ്പ് ചെയ്യാൻ പഠിപ്പിച്ചു. പരമ്പരാഗത ഡാറ്റ ഉപയോഗിച്ച് പരിശീലനം ലഭിച്ച ഒരു ന്യൂറൽ നെറ്റ്‌വർക്കിനെതിരെ സംഘം നോർമനെ പ്രതിഷ്ഠിച്ചു. ഗവേഷകർ രണ്ട് സിസ്റ്റങ്ങൾക്കും റോർഷാക്ക് ഇങ്ക്ബ്ലോട്ടുകൾ നൽകുകയും അവർ കണ്ടത് വിവരിക്കാൻ AI-കളോട് ആവശ്യപ്പെടുകയും ചെയ്തു. ഫലങ്ങൾ അതിശയിപ്പിക്കുന്നതായിരുന്നു: സ്റ്റാൻഡേർഡ് ന്യൂറൽ നെറ്റ്‌വർക്ക് "ഒരു ബേസ്ബോൾ കയ്യുറയുടെ കറുപ്പും വെളുപ്പും ഉള്ള ഫോട്ടോ" കണ്ടപ്പോൾ, "പകൽ വെളിച്ചത്തിൽ മെഷീൻ ഗൺ ഉപയോഗിച്ച് ഒരാളെ കൊലപ്പെടുത്തിയത്" നോർമൻ നിരീക്ഷിച്ചു. AI സ്വയമേവ പക്ഷപാതപരമല്ലെന്ന് പരീക്ഷണം തെളിയിച്ചു, എന്നാൽ ആ ഡാറ്റ ഇൻപുട്ട് രീതികളും അവയുടെ സ്രഷ്‌ടാക്കളുടെ ഉദ്ദേശ്യങ്ങളും AI-യുടെ സ്വഭാവത്തെ സാരമായി ബാധിക്കും.

    തടസ്സപ്പെടുത്തുന്ന ആഘാതം

    2021-ൽ, അലൻ ഇൻസ്റ്റിറ്റ്യൂട്ട് ഫോർ AI എന്ന ഗവേഷണ സ്ഥാപനം, ഏത് ധാർമ്മിക ചോദ്യത്തിനും ഉത്തരങ്ങൾക്കായി അൽഗോരിതമായി പ്രതികരണങ്ങൾ സൃഷ്ടിക്കുന്ന ഒരു ML സോഫ്റ്റ്‌വെയറായ Ask Delphi സൃഷ്ടിച്ചു. AI ക്രമേണ കൂടുതൽ ശക്തവും പരിചിതവുമാകുന്നുവെന്ന് പ്രോജക്റ്റിന് പിന്നിലെ ഗവേഷകർ പ്രസ്താവിച്ചു, അതിനാൽ ശാസ്ത്രജ്ഞർ ഈ ML സിസ്റ്റങ്ങളുടെ നൈതികത പഠിപ്പിക്കേണ്ടതുണ്ട്. യുണികോൺ എംഎൽ മോഡലാണ് ഡെൽഫിയുടെ അടിത്തറ. ഒരു ടെക്സ്റ്റ് സ്ട്രിംഗിലേക്ക് ഏറ്റവും സാധ്യതയുള്ള അവസാനത്തെ തിരഞ്ഞെടുക്കുന്നത് പോലെയുള്ള "സാമാന്യബുദ്ധി" ന്യായവാദം നടപ്പിലാക്കുന്നതിനാണ് ഇത് രൂപപ്പെടുത്തിയത്. 

    കൂടാതെ, ഗവേഷകർ 'കോമൺസെൻസ് നോം ബാങ്ക്.' റെഡ്ഡിറ്റ് പോലുള്ള സ്ഥലങ്ങളിൽ നിന്നുള്ള ആളുകളുടെ ധാർമ്മിക മൂല്യനിർണ്ണയത്തിന്റെ 1.7 ദശലക്ഷം ഉദാഹരണങ്ങൾ ഈ ബാങ്ക് ഉൾക്കൊള്ളുന്നു. തൽഫലമായി, ഡെൽഫിയുടെ ഔട്ട്പുട്ട് ഒരു മിക്സഡ് ബാഗായിരുന്നു. ഡെൽഫി ചില ചോദ്യങ്ങൾക്ക് യുക്തിസഹമായി ഉത്തരം നൽകി (ഉദാ. സ്ത്രീപുരുഷ സമത്വം), എന്നാൽ ചില വിഷയങ്ങളിൽ ഡെൽഫി തികച്ചും നിന്ദ്യമായിരുന്നു (ഉദാ: വംശഹത്യ ആളുകളെ സന്തോഷിപ്പിക്കുന്നിടത്തോളം സ്വീകാര്യമാണ്).

    എന്നിരുന്നാലും, ഡെൽഫി AI അതിന്റെ അനുഭവങ്ങളിൽ നിന്ന് പഠിക്കുകയും ഫീഡ്‌ബാക്ക് അടിസ്ഥാനമാക്കി അതിന്റെ ഉത്തരങ്ങൾ അപ്‌ഡേറ്റ് ചെയ്യുകയും ചെയ്യുന്നു. ഗവേഷണത്തിന്റെ പൊതുവായതും തുറന്നതുമായ ഉപയോഗത്തിൽ ചില വിദഗ്‌ധർ അസ്വസ്ഥരാണ്, മോഡൽ പുരോഗതിയിലാണെന്നും തെറ്റായ ഉത്തരങ്ങൾക്ക് സാധ്യതയുണ്ടെന്നും പരിഗണിക്കുന്നു. ആസ്ക് ഡെൽഫി അരങ്ങേറ്റം കുറിച്ചപ്പോൾ, ലിംഗഭേദം, തൊഴിൽ, കമ്പ്യൂട്ടിംഗ് ചരിത്രം എന്നിവയിൽ വൈദഗ്ദ്ധ്യം നേടിയ ഇല്ലിനോയിസ് ടെക്കിലെ ഹിസ്റ്ററി പ്രൊഫസറായ മാർ ഹിക്സ് പറഞ്ഞു, ഇത് ഉപയോഗിക്കാൻ ആളുകളെ ക്ഷണിക്കുന്നത് ഗവേഷകരുടെ അശ്രദ്ധയാണെന്ന് ഡെൽഫി ഉടൻ തന്നെ വളരെ അധാർമ്മികമായ ഉത്തരങ്ങൾ നൽകി. തികഞ്ഞ അസംബന്ധം. 

    ക്സനുമ്ക്സ ൽ, ബാക്കി ലോകം AI ഇമേജ് ജനറേറ്ററുകളിലെ പക്ഷപാതത്തെക്കുറിച്ച് ഒരു പഠനം നടത്തി. മിഡ്‌ജോർണി ഉപയോഗിച്ച്, സൃഷ്ടിച്ച ചിത്രങ്ങൾ നിലവിലുള്ള സ്റ്റീരിയോടൈപ്പുകളെ സ്ഥിരീകരിക്കുന്നുവെന്ന് ഗവേഷകർ കണ്ടെത്തി. കൂടാതെ, ഓപ്പൺഎഐ അതിന്റെ DALL-E 2 ഇമേജ് ജനറേഷൻ മോഡലിനായുള്ള പരിശീലന ഡാറ്റയിൽ ഫിൽട്ടറുകൾ പ്രയോഗിച്ചപ്പോൾ, അത് ലിംഗഭേദവുമായി ബന്ധപ്പെട്ട പക്ഷപാതങ്ങളെ മനപ്പൂർവ്വം തീവ്രമാക്കുന്നു.

    പ്രശ്നകരമായ പരിശീലന ഡാറ്റയുടെ പ്രത്യാഘാതങ്ങൾ

    പ്രശ്നകരമായ പരിശീലന ഡാറ്റയുടെ വിശാലമായ പ്രത്യാഘാതങ്ങൾ ഉൾപ്പെടാം: 

    • ഗവേഷണ പ്രോജക്ടുകൾ, സേവനങ്ങൾ, പ്രോഗ്രാം വികസനം എന്നിവയിലെ പക്ഷപാതങ്ങൾ ശക്തിപ്പെടുത്തി. നിയമപാലകരിലും ബാങ്കിംഗ് സ്ഥാപനങ്ങളിലും (ഉദാഹരണത്തിന്, ന്യൂനപക്ഷ വിഭാഗങ്ങളെ പ്രതികൂലമായി ടാർഗെറ്റുചെയ്യുന്നത്) ഉപയോഗിച്ചാൽ പ്രശ്നകരമായ പരിശീലന ഡാറ്റ പ്രത്യേകിച്ചും പ്രസക്തമാണ്.
    • പരിശീലന ഡാറ്റയുടെ വളർച്ചയിലും ശേഖരണത്തിലും വർദ്ധിച്ച നിക്ഷേപവും വികസനവും. 
    • വിവിധ വാണിജ്യ സംരംഭങ്ങൾക്കായി കോർപ്പറേഷനുകൾ എങ്ങനെ വികസിപ്പിക്കുകയും വിൽക്കുകയും പരിശീലന ഡാറ്റ ഉപയോഗിക്കുകയും ചെയ്യുന്നു എന്നതിനെ പരിമിതപ്പെടുത്താൻ കൂടുതൽ ഗവൺമെന്റുകൾ നിയന്ത്രണങ്ങൾ വർദ്ധിപ്പിക്കുന്നു.
    • AI സംവിധാനങ്ങൾ നൽകുന്ന പ്രോജക്ടുകൾ ധാർമ്മിക മാർഗ്ഗനിർദ്ദേശങ്ങൾ പാലിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കാൻ കൂടുതൽ ബിസിനസുകൾ എത്തിക്‌സ് ഡിപ്പാർട്ട്‌മെന്റുകൾ സ്ഥാപിക്കുന്നു.
    • ആരോഗ്യ സംരക്ഷണത്തിൽ AI-യുടെ ഉപയോഗത്തെക്കുറിച്ചുള്ള വിപുലമായ സൂക്ഷ്മപരിശോധന, കർശനമായ ഡാറ്റാ ഭരണത്തിലേക്ക് നയിക്കുന്നു, രോഗിയുടെ സ്വകാര്യതയും ധാർമ്മിക AI പ്രയോഗവും ഉറപ്പാക്കുന്നു.
    • AI സാക്ഷരത വളർത്തുന്നതിന് പൊതു-സ്വകാര്യ മേഖലാ സഹകരണം വർദ്ധിപ്പിച്ചു, AI- ആധിപത്യമുള്ള ഭാവിക്കായി തൊഴിൽ ശക്തിയെ പ്രാപ്തരാക്കുന്നു.
    • ഉപഭോക്തൃ ധാരണയ്ക്കും വിശ്വാസത്തിനുമായി AI സിസ്റ്റങ്ങളിലെ വിശദീകരണത്തിന് മുൻഗണന നൽകുന്ന മുൻനിര കമ്പനികൾ, AI സുതാര്യത ടൂളുകളുടെ ആവശ്യകതയിൽ വർദ്ധനവ്.

    പരിഗണിക്കേണ്ട ചോദ്യങ്ങൾ

    • പ്രശ്‌നകരമായ പരിശീലന ഡാറ്റ ഉപയോഗിക്കുന്നത് ഓർഗനൈസേഷനുകൾക്ക് എങ്ങനെ ഒഴിവാക്കാം?
    • അധാർമിക പരിശീലന ഡാറ്റയുടെ മറ്റ് സാധ്യതയുള്ള അനന്തരഫലങ്ങൾ എന്തൊക്കെയാണ്?