সুপারসাইজড এআই মডেল: জায়ান্ট কম্পিউটিং সিস্টেম টিপিং পয়েন্টে পৌঁছেছে

ইমেজ ক্রেডিট:
চিত্র ক্রেডিট
iStock

সুপারসাইজড এআই মডেল: জায়ান্ট কম্পিউটিং সিস্টেম টিপিং পয়েন্টে পৌঁছেছে

সুপারসাইজড এআই মডেল: জায়ান্ট কম্পিউটিং সিস্টেম টিপিং পয়েন্টে পৌঁছেছে

উপশিরোনাম পাঠ্য
মেশিন লার্নিং গাণিতিক মডেলগুলি বার্ষিক বৃহত্তর এবং আরও পরিশীলিত হয়ে উঠছে, তবে বিশেষজ্ঞরা মনে করেন এই বিস্তৃত অ্যালগরিদমগুলি শীর্ষে পৌঁছেছে৷
    • লেখক:
    • লেখকের নাম
      কোয়ান্টামরুন দূরদর্শিতা
    • জুন 2, 2023

    2012 সাল থেকে, কৃত্রিম বুদ্ধিমত্তার (AI) উল্লেখযোগ্য অগ্রগতি নিয়মিতভাবে ঘটেছে, প্রধানত কম্পিউটিং শক্তি বৃদ্ধির (সংক্ষেপে "গণনা") দ্বারা চালিত হয়েছে। 2020 সালে লঞ্চ হওয়া সবচেয়ে বড় মডেলগুলির মধ্যে একটি, 600,000 থেকে প্রথম মডেলের তুলনায় 2012 গুণ বেশি কম্পিউট ব্যবহার করেছে৷ OpenAI-এর গবেষকরা 2018 সালে এই প্রবণতাটি উল্লেখ করেছেন এবং সতর্ক করেছেন যে এই বৃদ্ধির হার বেশি দিন টেকসই হবে না৷

    সুপারসাইজড এআই মডেলের প্রসঙ্গ

    অনেক মেশিন লার্নিং (ML) ডেভেলপাররা তাদের আপাতদৃষ্টিতে সীমাহীন সম্ভাবনার কারণে গভীর শিক্ষার (DL) জন্য ট্রান্সফরমার মডেল ব্যবহার করে। এই মডেলগুলির উদাহরণগুলির মধ্যে রয়েছে জেনারেটিভ প্রাক-প্রশিক্ষিত ট্রান্সফরমার 2 (GPT-2), GPT-3, ট্রান্সফরমার (BERT) থেকে দ্বিমুখী এনকোডার প্রতিনিধিত্ব, এবং টুরিং ন্যাচারাল ল্যাঙ্গুয়েজ জেনারেশন (NLG)। এই অ্যালগরিদমগুলিতে প্রায়ই বাস্তব-বিশ্বের অ্যাপ্লিকেশন থাকে যেমন মেশিন অনুবাদ বা সময় সিরিজের পূর্বাভাস। 

    কৃত্রিম বুদ্ধিমত্তা মোডগুলিকে আরও প্রশিক্ষণের ডেটা মিটমাট করার জন্য প্রসারিত করতে হবে এবং ভবিষ্যদ্বাণীতে আরও ভাল হতে হবে। এই প্রয়োজনীয়তা বিলিয়ন প্যারামিটার সহ সুপারসাইজ মডেলের উত্থানের দিকে পরিচালিত করেছে (অ্যালগরিদম দ্বারা ভবিষ্যদ্বাণী করতে ব্যবহৃত ভেরিয়েবল)। এই মডেলগুলিকে OpenAI-এর GPT-3 (এবং ডিসেম্বর 2022-এ চালু করা ChatGPT ইন্টারঅ্যাকশন), চীন-ভিত্তিক PanGu-alpha, Nvidia-এর Megatron-Turing NLG, এবং DeepMind-এর Gopher দ্বারা প্রতিনিধিত্ব করা হয়। 2020 সালে, GPT-3 প্রশিক্ষণের জন্য একটি সুপার কম্পিউটার প্রয়োজন যা বিশ্বের পাঁচটি বৃহত্তম কম্পিউটারের মধ্যে ছিল। 

    যাইহোক, এই মডেলগুলির জন্য প্রচুর পরিমাণে শক্তি-নিবিড় প্রশিক্ষণ ডেটার প্রয়োজন হয়। গভীর শিক্ষা নির্ভর করে তার বিপুল কম্পিউট শক্তি ব্যবহার করার ক্ষমতার উপর, কিন্তু এটি শীঘ্রই পরিবর্তিত হবে। প্রশিক্ষণ ব্যয়বহুল, এআই চিপগুলির সীমাবদ্ধতা রয়েছে এবং বড় মডেলের প্রশিক্ষণ প্রসেসরগুলিকে আটকে রাখে, সেগুলিকে পরিচালনা করা কঠিন করে তোলে। প্যারামিটার যত বড় হবে, এই মডেলগুলিকে প্রশিক্ষণ দেওয়া তত ব্যয়বহুল। বিশেষজ্ঞরা একমত যে এমন একটি বিন্দু আসবে যেখানে সুপারসাইজড এআই মডেলগুলি প্রশিক্ষণের জন্য খুব ব্যয়বহুল এবং শক্তি-নিবিড় হয়ে উঠতে পারে। 

    বিঘ্নিত প্রভাব

    2020 সালে, ওপেনএআই প্যারামিটারের সংখ্যা এবং ডেটাসেটের আকারের উপর ভিত্তি করে অসংখ্য মডেলকে প্রশিক্ষণের জন্য প্রয়োজনীয় ন্যূনতম পরিমাণ গণনার অনুমান করেছে। এই সমীকরণগুলি কীভাবে ML-এর নেটওয়ার্কের মধ্য দিয়ে অনেকবার ডেটা পাস করার প্রয়োজন হয়, প্যারামিটারের সংখ্যা বাড়ার সাথে সাথে প্রতিটি পাসের গণনা কীভাবে বৃদ্ধি পায় এবং প্যারামিটারের সংখ্যা বাড়লে কত ডেটার প্রয়োজন হয় তার জন্য হিসাব করে।

    ওপেন এআই অনুমান অনুসারে, অনুমান করে যে বিকাশকারীরা সর্বাধিক দক্ষতা অর্জন করতে পারে, GPT-4 (GPT-100 (3 ট্রিলিয়ন প্যারামিটার) এর থেকে 17.5 গুণ বড়) তৈরি করতে 7,600 গ্রাফিক্স প্রসেসিং ইউনিট (GPUs) কমপক্ষে এক বছরের জন্য চলবে এবং প্রায় খরচ হবে USD $200 মিলিয়ন। একটি 100-ট্রিলিয়ন প্যারামিটার মডেলকে এক বছরের জন্য শক্তি দিতে 83,000 GPU লাগবে, যার খরচ USD $2 বিলিয়নের বেশি।

    তা সত্ত্বেও, এমএল সলিউশনের চাহিদা বাড়ার সাথে সাথে প্রযুক্তি সংস্থাগুলি তাদের ক্রমবর্ধমান সুপারসাইজড এআই মডেলগুলিতে সহযোগিতা করছে এবং বিনিয়োগ করছে। উদাহরণস্বরূপ, চীন ভিত্তিক Baidu এবং Peng Cheng ল্যাব PCL-BAIDU Wenxin প্রকাশ করেছে, 280 বিলিয়ন প্যারামিটার সহ। PCL-BAIDU ইতিমধ্যেই Baidu-এর নিউজ ফিড, সার্চ ইঞ্জিন, এবং ডিজিটাল সহকারী দ্বারা ব্যবহৃত হচ্ছে৷ 

    2021 সালের ডিসেম্বরে ডিপমাইন্ড তৈরি করা সর্বশেষ গো-প্লেয়িং প্রোগ্রাম সংস্করণে 280 বিলিয়ন প্যারামিটার রয়েছে। গুগল সুইচ-ট্রান্সফরমার-জিএলএএম মডেলগুলির যথাক্রমে 1 ট্রিলিয়ন এবং 1.2 ট্রিলিয়ন প্যারামিটার রয়েছে৷ এআইয়ের বেইজিং একাডেমি থেকে উ ডাও 2.0 আরও বেশি বিশাল এবং এতে 1.75 ট্রিলিয়ন প্যারামিটার রয়েছে বলে জানা গেছে। যেহেতু স্মার্ট শহর এবং স্বয়ংক্রিয়তা ব্যাঘাত ঘটাচ্ছে, বিশেষজ্ঞরা অনিশ্চিত যে কীভাবে এআই কম্পিউট এমন ভবিষ্যতে সমর্থন করবে। 

    সুপারসাইজড এআই মডেলের প্রভাব

    সুপারসাইজড এআই মডেলের বিস্তৃত প্রভাব অন্তর্ভুক্ত হতে পারে: 

    • কম শক্তি খরচ করে এমন AI কম্পিউটার চিপ তৈরিতে বিনিয়োগ এবং সুযোগ বৃদ্ধি। 
    • কম্পিউটিং শক্তির অভাবের কারণে এআই অগ্রগতি ধীর হয়ে যায়, যার ফলে শক্তি-সংরক্ষণকারী প্রযুক্তি এবং সমাধানগুলির জন্য আরও তহবিল পাওয়া যায়।
    • এমএল ডেভেলপাররা ট্রান্সফরমার বাদ দিয়ে বিকল্প মডেল তৈরি করে, যা আরও দক্ষ অ্যালগরিদমের জন্য আবিষ্কার এবং উদ্ভাবনের দিকে নিয়ে যেতে পারে।
    • AI সমাধানগুলি অ্যাপ্লিকেশন-কেন্দ্রিক সমস্যার উপর ফোকাস করে, সেই অনুযায়ী গণনা সামঞ্জস্য করে বা শুধুমাত্র সুপারসাইজ করার পরিবর্তে প্রয়োজন অনুসারে পরিবর্তন করে।
    • আরও জটিল ডেটাসেট যা এআই প্রোগ্রামগুলিকে আবহাওয়ার পূর্বাভাস, মহাকাশ আবিষ্কার, চিকিৎসা নির্ণয় এবং আন্তর্জাতিক বাণিজ্য সহ আরও ভাল ভবিষ্যদ্বাণী করতে দেয়।

    মন্তব্য করার জন্য প্রশ্ন

    • আপনি যদি এআই সেক্টরে কাজ করেন, তাহলে আরও ভালো এমএল মডেল তৈরিতে কিছু অগ্রগতি কী?
    • বিস্তৃত প্রশিক্ষণ ডেটা সহ মডেলগুলির অন্যান্য সম্ভাব্য সুবিধাগুলি কী থেকে শিখতে হবে?

    অন্তর্দৃষ্টি রেফারেন্স

    এই অন্তর্দৃষ্টির জন্য নিম্নলিখিত জনপ্রিয় এবং প্রাতিষ্ঠানিক লিঙ্কগুলি উল্লেখ করা হয়েছে: