ከፍተኛ መጠን ያላቸው AI ሞዴሎች፡ ግዙፍ የኮምፒዩቲንግ ሲስተሞች ጫፍ ላይ እየደረሱ ነው።

የምስል ክሬዲት፡
የምስል ክሬዲት
iStock

ከፍተኛ መጠን ያላቸው AI ሞዴሎች፡ ግዙፍ የኮምፒዩቲንግ ሲስተሞች ጫፍ ላይ እየደረሱ ነው።

ከፍተኛ መጠን ያላቸው AI ሞዴሎች፡ ግዙፍ የኮምፒዩቲንግ ሲስተሞች ጫፍ ላይ እየደረሱ ነው።

ንዑስ ርዕስ ጽሑፍ
የማሽን መማሪያ ሒሳባዊ ሞዴሎች በየአመቱ እየጨመሩ እና እየተሻሻሉ መጥተዋል፣ ነገር ግን ባለሙያዎች እነዚህ ሰፊ ስልተ ቀመሮች ከፍተኛ ደረጃ ላይ ሊደርሱ ነው ብለው ያስባሉ።
    • ደራሲ:
    • የደራሲ ስም
      ኳንተምሩን አርቆ እይታ
    • ሰኔ 2, 2023

    ከ 2012 ጀምሮ በአርቴፊሻል ኢንተለጀንስ (AI) ውስጥ ጉልህ እድገቶች በመደበኛነት ተከስተዋል ፣ በዋናነት የኮምፒዩተር ኃይልን በማሳደግ (በአጭሩ “ማስላት”)። እ.ኤ.አ. በ2020 ከተጀመሩት ትላልቅ ሞዴሎች መካከል አንዱ ከ600,000 የመጀመሪያው ሞዴል በ2012 እጥፍ የበለጠ ስሌት ተጠቅሟል። በOpenAI ተመራማሪዎች በ2018 ይህንን አዝማሚያ ተመልክተው ይህ የእድገት መጠን ለረጅም ጊዜ ዘላቂ እንደማይሆን አስጠንቅቀዋል።

    ልዕለ-መጠን የኤይ ሞዴሎች አውድ

    ብዙ የማሽን መማሪያ (ML) ገንቢዎች ገደብ የለሽ ስለሚመስሉ ለጥልቅ ትምህርት (ዲኤል) የትራንስፎርመር ሞዴሎችን ይጠቀማሉ። የእነዚህ ሞዴሎች ምሳሌዎች ጀነሬቲቭ ቅድመ-የሰለጠነ ትራንስፎርመር 2 (GPT-2)፣ GPT-3፣ ባለሁለት አቅጣጫ ጠቋሚ ከትራንስፎርመሮች (BERT) እና ቱሪንግ የተፈጥሮ ቋንቋ ማመንጨት (NLG) ያካትታሉ። እነዚህ ስልተ ቀመሮች ብዙውን ጊዜ እንደ ማሽን ትርጉም ወይም የጊዜ ተከታታይ ትንበያ ያሉ የገሃዱ ዓለም አፕሊኬሽኖች አሏቸው። 

    ተጨማሪ የሥልጠና መረጃዎችን ለማስተናገድ እና ትንበያዎች ላይ የተሻሉ ለመሆን ሰው ሰራሽ የማሰብ ዘዴዎች መስፋፋት አለባቸው። ይህ መስፈርት በቢሊዮኖች የሚቆጠሩ መለኪያዎች (መተንበያ ለማድረግ በአልጎሪዝም ጥቅም ላይ የሚውሉ ተለዋዋጮች) ከፍተኛ መጠን ያላቸው ሞዴሎች እንዲነሱ አድርጓል። እነዚህ ሞዴሎች በOpenAI's GPT-3 (እና የቻትጂፒቲ ግንኙነቱ በታህሳስ 2022 የተጀመረ)፣ ቻይና ላይ የተመሰረተ PanGu-alpha፣ Nvidia's Megatron-Turing NLG እና DeepMind's Gopher ይወከላሉ። እ.ኤ.አ. በ 2020 GPT-3ን ማሰልጠን በዓለም ላይ ካሉ አምስት ትልልቅ ሰዎች መካከል የሆነ ሱፐር ኮምፒውተር ያስፈልጋል። 

    ይሁን እንጂ እነዚህ ሞዴሎች ከፍተኛ መጠን ያለው ኃይል-ተኮር የሥልጠና መረጃ ይፈልጋሉ። ጥልቅ ትምህርት ግዙፍ የኮምፒዩተር ሃይልን ለመጠቀም ባለው ችሎታ ላይ የተመካ ነው፣ ነገር ግን ይህ በቅርቡ ይለወጣል። ስልጠና ውድ ነው፣ ለ AI ቺፕስ ገደብ አለው፣ እና ትልልቅ ሞዴሎችን ማሰልጠን ፕሮሰሰሮችን ስለሚዘጋው ሁሉንም ለማስተዳደር አስቸጋሪ ያደርገዋል። መለኪያው ትልቅ ከሆነ, እነዚህን ሞዴሎች ማሰልጠን የበለጠ ውድ ነው. ከፍተኛ መጠን ያላቸው የኤአይአይ ሞዴሎች በጣም ውድ እና ለማሰልጠን ጉልበት የሚጨምሩበት ጊዜ እንደሚመጣ ባለሙያዎች ይስማማሉ። 

    የሚረብሽ ተጽእኖ

    እ.ኤ.አ. በ 2020 ፣ OpenAI በርካታ ሞዴሎችን ለማሰልጠን የሚያስፈልገውን አነስተኛውን የሂሳብ መጠን ገምቷል ፣በመለኪያዎች ብዛት እና የውሂብ ስብስብ መጠን። እነዚህ እኩልታዎች ኤምኤል መረጃ በኔትወርኩ ውስጥ ብዙ ጊዜ እንዲያልፍ እንዴት እንደሚያስፈልግ፣ የመለኪያዎች ብዛት ሲጨምር ለእያንዳንዱ ማለፊያ ስሌት እንዴት እንደሚጨምር እና የመለኪያዎች ብዛት ሲያድግ ምን ያህል ውሂብ እንደሚያስፈልግ ይገልፃሉ።

    እንደ Open AI ግምቶች፣ ገንቢዎች ከፍተኛ ቅልጥፍናን ሊያገኙ ይችላሉ ተብሎ ሲታሰብ GPT-4 (ከ GPT-100 3 እጥፍ የሚበልጡ (17.5 ትሪሊዮን መለኪያዎች)) 7,600 ግራፊክስ ማቀነባበሪያ ክፍሎች (ጂፒዩዎች) ቢያንስ ለአንድ ዓመት እንዲሠሩ እና በግምት ወጪ ይጠይቃል። 200 ሚሊዮን ዶላር። የ100 ትሪሊየን ፓራሜትር ሞዴል ለአንድ አመት ኃይል ለመስጠት 83,000 ጂፒዩዎች ያስፈልገዋል፣ ይህም ከ2 ቢሊዮን ዶላር በላይ ወጪ ነው።

    ቢሆንም፣ የቴክኖሎጂ ኩባንያዎች የኤምኤል መፍትሔዎች ፍላጎት እያደገ በመጣ ቁጥር እየጨመረ በሚሄደው የላቀ የኤአይአይ ሞዴሎቻቸው ላይ በመተባበር እና ኢንቨስት ሲያደርጉ ቆይተዋል። ለምሳሌ፣ በቻይና ያደረገው Baidu እና Peng Cheng Lab PCL-BAIDU Wenxinን በ280 ቢሊዮን መለኪያዎች አወጡ። PCL-BAIDU አስቀድሞ በBaidu የዜና ምግቦች፣ የፍለጋ ሞተር እና ዲጂታል ረዳት እየተጠቀመበት ነው። 

    DeepMind በታህሳስ 2021 የፈጠረው የቅርብ ጊዜ Go-playing ፕሮግራም ስሪት 280 ቢሊዮን መለኪያዎች አሉት። የጎግል ስዊች-ትራንስፎርመር-ጂላኤም ሞዴሎች በቅደም ተከተል 1 ትሪሊዮን እና 1.2 ትሪሊዮን መለኪያዎች አሏቸው። Wu Dao 2.0 ከቤጂንግ አካዳሚ የበለጠ ግዙፍ እና 1.75 ትሪሊዮን መለኪያዎች እንዳሉት ተዘግቧል። ብልጥ ከተሞች እና አውቶማቲክ ማቋረጦችን መግፋታቸውን ሲቀጥሉ ባለሙያዎች AI ስሌት ለወደፊቱ እንዴት እንደሚደግፍ እርግጠኛ አይደሉም። 

    ከፍተኛ መጠን ያላቸው AI ሞዴሎች አንድምታ

    ከፍተኛ መጠን ያላቸው AI ሞዴሎች ሰፋ ያሉ እንድምታዎች የሚከተሉትን ሊያካትቱ ይችላሉ፡ 

    • አነስተኛ ጉልበት የሚወስዱ የ AI ኮምፒውተር ቺፖችን በማዘጋጀት ላይ ኢንቨስትመንቶች እና እድሎች ጨምረዋል። 
    • የ AI ግስጋሴ በኮምፒዩተር ሃይል እጦት ቀንሷል፣ ይህም ለሃይል ቆጣቢ ቴክኖሎጂዎች እና መፍትሄዎች ተጨማሪ ገንዘብ እንዲሰጥ አድርጓል።
    • የኤምኤል ገንቢዎች ከትራንስፎርመሮች ወደ ጎን ተለዋጭ ሞዴሎችን ይፈጥራሉ፣ ይህም ወደ ግኝቶች እና ፈጠራዎች የበለጠ ቀልጣፋ ስልተ ቀመሮችን ይፈጥራል።
    • አፕሊኬሽንን ማዕከል ባደረጉ ችግሮች ላይ ያተኮሩ AI መፍትሄዎች፣ ኮምፒዩተሩን በዛው ልክ ማስተካከል ወይም እንደ አስፈላጊነቱ በመጠን ከመጨመር ይልቅ ማሻሻል።
    • የአየር ሁኔታ ትንበያዎችን፣ የቦታ ግኝትን፣ የህክምና ምርመራዎችን እና አለምአቀፍ ንግድን ጨምሮ AI ፕሮግራሞች የተሻሉ ትንበያዎችን እንዲሰሩ የሚያስችላቸው ይበልጥ ውስብስብ የውሂብ ስብስቦች።

    አስተያየት ለመስጠት ጥያቄዎች

    • በ AI ዘርፍ ውስጥ የሚሰሩ ከሆነ የተሻሉ የኤምኤል ሞዴሎችን በማዘጋጀት ረገድ ምን መሻሻል አለ?
    • ለመማር ሰፊ የሥልጠና መረጃ ያላቸው ሞዴሎች ሌሎች ሊሆኑ የሚችሉ ጥቅሞች ምንድ ናቸው?

    የማስተዋል ማጣቀሻዎች

    ለዚህ ግንዛቤ የሚከተሉት ታዋቂ እና ተቋማዊ አገናኞች ተጠቅሰዋል።