د سترو AI ماډلونو لوی کمپیوټري سیسټمونه پای ته رسیدلي دي

د انځور کریډیټ:

ایسته

د AI عالي ماډلونه: لوی کمپیوټري سیسټمونه د پای ټکي ته رسي

د ماشین زده کړې ریاضیاتي ماډلونه هر کال لوی او خورا پیچلي کیږي، مګر کارپوهان فکر کوي چې دا پراخ شوي الګوریتمونه د لوړوالي په حال کې دي.

لیکونکی:
د لیکوال نوم
Quantumrun وړاندوینه
د جون په 2، 2023

د 2012 راهیسې، په مصنوعي استخباراتو (AI) کې د پام وړ پرمختګونه په منظمه توګه پیښ شوي، په عمده توګه د کمپیوټري ځواک د زیاتوالي (د لنډ لپاره "کمپیوټ") لخوا پرمخ وړل کیږي. یو له سترو ماډلونو څخه چې په 2020 کې پیل شوی، د 600,000 څخه د لومړي ماډل په پرتله 2012 ځله ډیر کمپیوټر کارولی. په OpenAI کې څیړونکو په 2018 کې دا رجحان یادونه وکړه او خبرداری یې ورکړ چې د ودې کچه به د اوږدې مودې لپاره دوام ونلري.

د عالي AI ماډلونو شرایط

د ماشین زده کړې (ML) ډیری پراختیا کونکي د ژورې زده کړې (DL) لپاره د ټرانسفارمر ماډلونه کاروي ځکه چې د دوی ظاهري محدود ظرفیت لري. د دې ماډلونو مثالونه د تولید دمخه روزل شوي ټرانسفارمر 2 (GPT-2)، GPT-3، د ټرانسفارمرونو څخه د دوه اړخیزه انکوډر نمایندګۍ (BERT)، او د تورینګ طبیعي ژبې تولید (NLG) شامل دي. دا الګوریتمونه ډیری وختونه د ریښتیني نړۍ غوښتنلیکونه لري لکه د ماشین ژباړه یا د وخت لړۍ وړاندوینه.

د مصنوعي استخباراتو طریقې باید پراخه شي ترڅو د روزنې ډیټا ځای په ځای کړي او په وړاندوینو کې ښه شي. دا اړتیا د ملیاردونو پیرامیټونو سره د سوپرسیز شوي ماډلونو رامینځته کیدو لامل شوې (تغیرات چې د وړاندوینې کولو لپاره د الګوریتم لخوا کارول کیږي). دا ماډلونه د OpenAI GPT-3 (او د ChatGPT تعامل په دسمبر 2022 کې پیل شوی) لخوا نمایش کیږي، د چین میشته PanGu-alpha، Nvidia's Megatron-Turing NLG، او DeepMind's Gopher. په 2020 کې، د GPT-3 روزنې یو سوپر کمپیوټر ته اړتیا درلوده چې په نړۍ کې د پنځو لویو څخه و.

په هرصورت، دا ماډلونه په پراخه کچه د انرژۍ په اړه د روزنې ډیټا ته اړتیا لري. ژوره زده کړه د لوی کمپیوټري ځواک کارولو وړتیا پورې اړه لري، مګر دا به ډیر ژر بدلون ومومي. روزنه ګرانه ده، د AI چپس لپاره محدودیتونه شتون لري، او د لوی ماډلونو روزنه پروسیسر بندوي، د دې ټولو اداره کول ستونزمن کوي. څومره چې پیرامیټر لوی وي، د دې ماډلونو روزل ګران وي. ماهرین موافق دي چې یو داسې ټکی به راشي چیرې چې د AI عالي ماډلونه د روزنې لپاره خورا ګران او انرژي لرونکي وي.

ګډوډي اغیزې

په 2020 کې، OpenAI د ډیری ماډلونو روزلو لپاره د اړتیا وړ لږ تر لږه اندازه محاسبه کړې، د پیرامیټونو شمیر او ډیټاسیټ اندازې کې فکتور کول. دا معادلې حساب کوي چې څنګه ML دا ډیټا ته اړتیا لري څو څو ځله د شبکې له لارې تیریږي ، د هر پاس لپاره محاسبه څنګه د پیرامیټرو شمیر ډیریږي ، او څومره ډیټا ته اړتیا ده کله چې د پیرامیټونو شمیر وده کوي.

د Open AI اټکلونو له مخې، داسې انګیرل چې پراختیا کونکي کولی شي اعظمي موثریت ترلاسه کړي، د GPT-4 جوړول (د GPT-100 څخه 3 ځله لوی (17.5 ټریلیون پارامترونه)) به د 7,600 ګرافیک پروسس کولو واحدونو (GPUs) ته اړتیا ولري چې لږترلږه د یو کال لپاره پرمخ ځي او نږدې لګښت لري. ۲۰۰ میلیونه ډالره. د 200-ټریلیون پیرامیټر ماډل به د 100 GPUs ته اړتیا ولري ترڅو دا د یو کال لپاره بریښنا کړي، چې د 83,000 ملیارد ډالرو څخه ډیر لګښت لري.

سره له دې، تخنیکي شرکتونه د دوی په دوامداره توګه د پراخیدونکي AI ماډلونو کې همکاري کوي او پانګونه کوي ځکه چې د ML حلونو غوښتنه وده کوي. د مثال په توګه، د چین میشته Baidu او پینګ چینګ لابراتوار د 280 ملیارد پیرامیټونو سره PCL-BAIDU وینکسین خپور کړ. PCL-BAIDU لا دمخه د Baidu نیوز فیډز، د لټون انجن، او ډیجیټل معاون لخوا کارول کیږي.

د Go-playing پروګرام وروستی نسخه، کوم چې DeepMind په دسمبر 2021 کې رامینځته کړی، 280 ملیارد پیرامیټونه لري. د ګوګل سویچ-ټرانسفارمر-GLaM ماډلونه په ترتیب سره د حیرانتیا وړ 1 ټریلیون او 1.2 ټریلیون پیرامیټونه لري. د AI د بیجینګ اکاډمۍ څخه وو داو 2.0 حتی خورا لوی دی او راپور شوي چې 1.75 ټریلیون پیرامیټونه لري. لکه څنګه چې سمارټ ښارونه او اتومات د خنډونو فشار ته دوام ورکوي ، ماهرین ډاډه ندي چې د AI محاسبه به څنګه د داسې راتلونکي ملاتړ وکړي.

د سپرسیز شوي AI ماډلونو اغیزې

د سپرسیز شوي AI ماډلونو پراخه اغیزې ممکن پدې کې شامل وي:

د AI کمپیوټر چپسونو رامینځته کولو کې د پانګوونې او فرصتونو زیاتوالی چې لږ انرژي مصرفوي.
د AI پرمختګ د کمپیوټري ځواک د نشتوالي له امله ورو شو، چې د انرژي ساتلو ټیکنالوژیو او حلونو لپاره د ډیرو تمویل لامل کیږي.
د ML پراختیا کونکي د ټرانسفارمرونو سربیره بدیل ماډلونه رامینځته کوي ، کوم چې کولی شي د ډیر موثر الګوریتمونو لپاره کشف او نوښت لامل شي.
د AI حلونه چې د غوښتنلیک متمرکز ستونزو باندې تمرکز کوي ، د حساب سره سم تنظیم کول یا د اړتیا سره سم ترمیم کول یوازې د سپرسائز کولو پرځای.
ډیر پیچلي ډیټاسیټونه د AI برنامو ته اجازه ورکوي چې غوره وړاندوینې ترسره کړي ، پشمول د هوا وړاندوینې ، د ځای کشف ، طبي تشخیص ، او نړیواله سوداګرۍ.

د نظر ورکولو لپاره پوښتنې

که تاسو د AI سکټور کې کار کوئ، د غوره ML ماډلونو په جوړولو کې کوم پرمختګ شتون لري؟
د زده کړې لپاره د پراخه روزنې ډیټا سره د ماډلونو نورې احتمالي ګټې څه دي؟

لیست ته زیاتول