Vokenization: ভাষা যা AI দেখতে পারে

ইমেজ ক্রেডিট:
চিত্র ক্রেডিট
iStock

Vokenization: ভাষা যা AI দেখতে পারে

Vokenization: ভাষা যা AI দেখতে পারে

উপশিরোনাম পাঠ্য
ছবিগুলো এখন কৃত্রিম বুদ্ধিমত্তা (AI) সিস্টেম প্রশিক্ষণে অন্তর্ভুক্ত হওয়ার সাথে সাথে, রোবট শীঘ্রই কমান্ড "দেখতে" সক্ষম হতে পারে।
    • লেখক:
    • লেখকের নাম
      কোয়ান্টামরুন দূরদর্শিতা
    • 9 পারে, 2023

    ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (এনএলপি) কৃত্রিম বুদ্ধিমত্তা (এআই) সিস্টেমকে শব্দ বোঝার মাধ্যমে এবং অনুভূতির সাথে প্রসঙ্গ মেলানোর মাধ্যমে মানুষের বক্তৃতা শিখতে সক্ষম করেছে। একমাত্র নেতিবাচক দিক হল এই NLP সিস্টেমগুলি সম্পূর্ণরূপে পাঠ্য-ভিত্তিক। Vokenization যে সব পরিবর্তন করতে হবে.

    ভোকেনাইজেশন প্রসঙ্গ

    দুটি টেক্সট-ভিত্তিক মেশিন লার্নিং (এমএল) প্রোগ্রাম প্রায়শই AI-কে মানুষের ভাষা প্রক্রিয়া ও বোঝার জন্য প্রশিক্ষণ দিতে ব্যবহৃত হয়: OpenAI-এর জেনারেটিভ প্রি-ট্রেনড ট্রান্সফরমার 3 (GPT-3) এবং Google-এর BERT (ট্রান্সফরমার থেকে দ্বিমুখী এনকোডার প্রতিনিধিত্ব)। AI পরিভাষায়, NLP প্রশিক্ষণে ব্যবহৃত শব্দগুলিকে টোকেন বলা হয়। ইউনিভার্সিটি অফ নর্থ ক্যারোলিনা (ইউএনসি) এর গবেষকরা পর্যবেক্ষণ করেছেন যে পাঠ্য-ভিত্তিক প্রশিক্ষণ প্রোগ্রামগুলি সীমিত কারণ তারা "দেখতে পারে না", যার অর্থ তারা ভিজ্যুয়াল তথ্য এবং যোগাযোগ ক্যাপচার করতে পারে না। 

    উদাহরণস্বরূপ, যদি কেউ GPT-3 কে জিজ্ঞাসা করে যে ভেড়ার রঙ কী, সিস্টেমটি প্রায়শই "কালো" উত্তর দেবে যদিও এটি পরিষ্কারভাবে সাদা হয়। এই প্রতিক্রিয়া কারণ পাঠ্য-ভিত্তিক সিস্টেম এটিকে সঠিক রঙ সনাক্ত করার পরিবর্তে "কালো ভেড়া" শব্দটির সাথে যুক্ত করবে। টোকেন (ভোকেন) সহ ভিজ্যুয়ালগুলিকে অন্তর্ভুক্ত করার মাধ্যমে, এআই সিস্টেমগুলি পদগুলির একটি সামগ্রিক বোঝার অধিকারী হতে পারে। ভোকেনাইজেশন স্ব-তত্ত্বাবধানে থাকা এনএলপি সিস্টেমে ভোকেনকে একীভূত করে, তাদের "সাধারণ জ্ঞান" বিকাশ করতে দেয়।

    ভাষা মডেল এবং কম্পিউটার দৃষ্টি একত্রিত করা একটি নতুন ধারণা নয়, এবং এটি এআই গবেষণার একটি দ্রুত সম্প্রসারিত ক্ষেত্র। এই দুই ধরনের AI এর সংমিশ্রণ তাদের স্বতন্ত্র শক্তিকে কাজে লাগায়। GPT-3-এর মতো ভাষার মডেলগুলিকে তত্ত্বাবধানহীন শিক্ষার মাধ্যমে প্রশিক্ষিত করা হয়, যা তাদের সহজেই স্কেল করতে দেয়। বিপরীতে, অবজেক্ট রিকগনিশন সিস্টেমের মতো ইমেজ মডেলগুলি সরাসরি বাস্তবতা থেকে শিখতে পারে এবং পাঠ্য দ্বারা প্রদত্ত বিমূর্ততার উপর নির্ভর করে না। উদাহরণ স্বরূপ, ছবির মডেলরা ছবি দেখে চিনতে পারে যে একটি ভেড়া সাদা।

    বিঘ্নিত প্রভাব

    ভোকেনাইজেশন প্রক্রিয়াটি বেশ সহজবোধ্য। ভাষার টোকেনগুলিতে সংশ্লিষ্ট বা প্রাসঙ্গিক চিত্রগুলি বরাদ্দ করে Vokens তৈরি করা হয়। তারপরে, অ্যালগরিদমগুলি (ভোকেনাইজার) তত্ত্বাবধানহীন শিক্ষার মাধ্যমে ভোকেন তৈরি করার জন্য ডিজাইন করা হয়েছে (কোন স্পষ্ট প্যারামিটার/নিয়ম নেই)। ভোকেনাইজেশনের মাধ্যমে প্রশিক্ষিত সাধারণ জ্ঞান এআই যোগাযোগ করতে পারে এবং সমস্যাগুলি আরও ভালভাবে সমাধান করতে পারে কারণ তাদের প্রেক্ষাপট সম্পর্কে আরও গভীরভাবে বোঝা রয়েছে। এই পদ্ধতিটি অনন্য কারণ এটি শুধুমাত্র ভাষার টোকেনগুলির ভবিষ্যদ্বাণী করে না বরং ইমেজ টোকেনগুলিরও ভবিষ্যদ্বাণী করে, যা এমন কিছু যা ঐতিহ্যগত BERT মডেলগুলি করতে অক্ষম৷

    উদাহরণস্বরূপ, রোবোটিক সহকারীরা চিত্রগুলিকে চিনতে এবং প্রক্রিয়াগুলিকে আরও ভালভাবে নেভিগেট করতে সক্ষম হবে কারণ তারা তাদের কী প্রয়োজন তা "দেখতে" পারে৷ বিষয়বস্তু লেখার জন্য প্রশিক্ষিত কৃত্রিম বুদ্ধিমত্তা সিস্টেমগুলি এমন নিবন্ধ তৈরি করতে সক্ষম হবে যা আরও মানবিক শোনাবে, বিচ্ছিন্ন বাক্যের পরিবর্তে আরও ভাল প্রবাহিত ধারণা সহ। এনএলপি অ্যাপ্লিকেশনগুলির বিস্তৃত নাগালের কথা বিবেচনা করে, ভোকেনাইজেশন ভাল-পারফর্মিং চ্যাটবট, ভার্চুয়াল সহকারী, অনলাইন চিকিৎসা নির্ণয়, ডিজিটাল অনুবাদক এবং আরও অনেক কিছুর দিকে নিয়ে যেতে পারে।

    উপরন্তু, দৃষ্টি এবং ভাষা শিক্ষার সমন্বয় চিকিৎসা ইমেজিং অ্যাপ্লিকেশনে জনপ্রিয়তা অর্জন করছে, বিশেষ করে স্বয়ংক্রিয় চিকিৎসা চিত্র নির্ণয়ের জন্য। উদাহরণস্বরূপ, কিছু গবেষক রেডিওগ্রাফ চিত্রের সাথে পাঠ্য বিবরণ সহ এই পদ্ধতির সাথে পরীক্ষা করছেন, যেখানে শব্দার্থিক বিভাজন সময়সাপেক্ষ হতে পারে। ভোকেনাইজেশন কৌশল এই উপস্থাপনাগুলিকে উন্নত করতে পারে এবং পাঠ্য তথ্য ব্যবহার করে স্বয়ংক্রিয় মেডিকেল ইমেজিং উন্নত করতে পারে।

    vokenization জন্য আবেদন

    ভোকেনাইজেশনের জন্য কিছু অ্যাপ্লিকেশন অন্তর্ভুক্ত হতে পারে:

    • স্বজ্ঞাত চ্যাটবট যা স্ক্রিনশট, ছবি এবং ওয়েবসাইট সামগ্রী প্রক্রিয়া করতে পারে। গ্রাহক সহায়তা চ্যাটবট, বিশেষ করে, পণ্য এবং পরিষেবাগুলি সঠিকভাবে সুপারিশ করতে সক্ষম হতে পারে।
    • ডিজিটাল অনুবাদক যারা ছবি এবং ভিডিও প্রক্রিয়া করতে পারে এবং একটি সঠিক অনুবাদ প্রদান করতে পারে যা সাংস্কৃতিক এবং পরিস্থিতিগত প্রেক্ষাপট বিবেচনা করে।
    • সোশ্যাল মিডিয়া বট স্ক্যানারগুলি ছবি, ক্যাপশন এবং মন্তব্যগুলিকে একত্রিত করে আরও সামগ্রিক অনুভূতি বিশ্লেষণ করতে সক্ষম। এই অ্যাপ্লিকেশানটি বিষয়বস্তু সংযম করার জন্য দরকারী হতে পারে যার জন্য ক্ষতিকারক চিত্রগুলির বিশ্লেষণ প্রয়োজন৷
    • কম্পিউটার ভিশন এবং এনএলপি মেশিন লার্নিং ইঞ্জিনিয়ার এবং ডেটা সায়েন্টিস্টদের জন্য কর্মসংস্থানের সুযোগ বৃদ্ধি করা।
    • এই AI সিস্টেমগুলিকে বাণিজ্যিকীকরণ করতে বা ব্যবসার জন্য কাস্টমাইজড সমাধান প্রদান করতে স্টার্টআপগুলি তৈরি করে৷

    মন্তব্য করার জন্য প্রশ্ন

    • আর কিভাবে আপনি মনে করেন যে ভোকেনাইজেশন আমরা কীভাবে রোবটের সাথে যোগাযোগ করি তা পরিবর্তন করবে?
    • আমরা কীভাবে ব্যবসা পরিচালনা করি এবং আমাদের গ্যাজেটগুলির (স্মার্টফোন এবং স্মার্ট অ্যাপ্লায়েন্স) সাথে যোগাযোগ করি কীভাবে ভোকেনাইজেশন পরিবর্তন করতে পারে?

    অন্তর্দৃষ্টি রেফারেন্স

    এই অন্তর্দৃষ্টির জন্য নিম্নলিখিত জনপ্রিয় এবং প্রাতিষ্ঠানিক লিঙ্কগুলি উল্লেখ করা হয়েছে: