فرآیندهای یادگیری یکپارچه یادگیری خود نظارتی در نهایت می تواند سازگار شود

اعتبار تصویر:

iStock

فرآیندهای یادگیری یکپارچه: یادگیری با نظارت خود در نهایت می تواند سازگار شود

محققان سرانجام راهی برای آموزش الگوریتم ها از طریق یک ورودی بدون توجه به نوع یا فرمت داده کشف کردند.

نویسنده:
نام نویسنده
آینده نگاری کوانتوم ران
فوریه 7، 2023

شبکه های عصبی عمیق به طور سنتی در شناسایی اشیاء در عکس ها و فیلم ها و همچنین پردازش زبان طبیعی خوب بوده اند. با این حال، بیشتر تحقیقات پیرامون الگوریتم‌های خود نظارتی بر روی روش‌های فردی متمرکز شده‌اند که می‌تواند منجر به سوگیری شود.

زمینه فرآیندهای یادگیری یکپارچه

با نظارت خود، رایانه ها می توانند با بررسی آنها و ساختن معنای تصاویر، ضبط های صوتی یا کلمات نوشته شده، در مورد محیط اطراف خود بیاموزند. داشتن ماشین هایی که برای تشخیص تصاویر یا درک زبان گفتاری نیازی به آموزش دستی ندارند کارآمدتر است. بیشتر تحقیقات یادگیری خود نظارت بر یک حوزه به جای چند روش متمرکز است. بنابراین، محققانی که روی یک حوزه تمرکز می کنند، اغلب استراتژی کاملاً متفاوتی با کسانی که روی حوزه دیگری تمرکز می کنند دارند.

به عنوان مثال، در پردازش گفتار، برخی از وظایف یادگیری خود نظارتی دارای واژگان واحدهای گفتاری نیستند. در نتیجه، چندین مدل با مکانیسم‌هایی ارائه می‌شوند که فهرستی از واحدهای گفتاری را یاد می‌گیرند. یادگیری نشانه‌ها، رگرسیون ورودی، یا افزایش داده‌ها از راه‌هایی هستند که محققان بینایی کامپیوتر در گذشته برای مبارزه با این موضوع تلاش کرده‌اند. با این حال، اغلب دشوار است که بگوییم آیا این روش ها خارج از زمینه اصلی مؤثر خواهند بود یا خیر.

بر اساس مطالعه‌ای در دانشگاه کرنل در سال ۲۰۲۲، نظریه‌های برتر در مورد زیست‌شناسی یادگیری نشان می‌دهد که انسان‌ها احتمالاً از فرآیندهای مشابهی برای درک تصاویر و زبان استفاده می‌کنند. به طور مشابه، معماری‌های عمومی شبکه عصبی از همتایان خاص مدالیته بهتر عمل کرده‌اند. به این ترتیب، در سال 2022، متا Data2022vec را معرفی کرد، سیستمی که از یک الگوریتم واحد برای آموزش شبکه عصبی برای تشخیص تصاویر، متن یا گفتار استفاده می کند.

تاثیر مخرب

الگوریتم‌ها تصاویر، متن و صدا را متفاوت پردازش می‌کنند زیرا واحدهای مجزایی مانند پیکسل‌ها، نشانه‌های بصری، کلمات یا موجودی صدا را پیش‌بینی می‌کنند. ایجاد الگوریتم‌ها مربوط به یک مدالیت خاص است، به این معنی که الگوریتم‌هایی که در مدالیته‌های مختلف هستند، متفاوت از یکدیگر به کار خود ادامه می‌دهند. Data2vec به مدل‌ها اجازه می‌دهد تا با تمرکز بر نمایش‌ها، مانند لایه‌های شبکه عصبی، با انواع ورودی‌های مختلف کار کنند. با data2vec، نیازی به پیش‌بینی نشانه‌های بصری، عبارات یا صداها نیست.

Data2vec نشان می دهد که یک الگوریتم خودآموز نه تنها می تواند در چندین سناریو به خوبی کار کند، بلکه اغلب بهتر از روش های سنتی تر عمل می کند. این ویژگی می‌تواند منجر به استفاده گسترده‌تر از یادگیری خود نظارت شود و ما را به ماشین‌های هوش مصنوعی نزدیک‌تر کند که می‌توانند موضوعات پیچیده‌ای مانند رویدادهای ورزشی یا روش‌های مختلف پخت نان را با استفاده از فیلم‌ها، مقاله‌ها و ضبط‌های صوتی آموزش دهند.

در مقاله‌ای در سال 2022 که در مجله نیچر منتشر شد، محققان کاربردهای امیدوارکننده یادگیری خود نظارتی را برای توسعه مدل‌هایی که از مجموعه داده‌های چندوجهی استفاده می‌کنند، برجسته کردند. این مطالعه همچنین برخی از چالش‌ها را در جمع‌آوری داده‌های بی‌طرفانه برای آموزش آنها، مانند روش‌های مورد استفاده در پزشکی و مراقبت‌های بهداشتی مورد بحث قرار داد. با یادگیری خود نظارتی، تیم می‌توانست ماشین‌ها را با استفاده از داده‌های بدون برچسب آموزش دهد. این شاهکار یک نقطه شروع عالی برای هر کار در پزشکی (و فراتر از آن) برای پیش بینی اطلاعات پنهانی است که نمی توان آنها را به وضوح طبقه بندی کرد. در آینده، الگوریتم‌ها قادر خواهند بود ورودی‌های باز را بهتر تشخیص دهند و آنها را بدون دخالت انسان با سایر مجموعه‌های داده مرتبط کنند.

پیامدهای فرآیندهای یادگیری یکپارچه

پیامدهای گسترده تر فرآیندهای یادگیری یکپارچه ممکن است شامل موارد زیر باشد:

ربات‌های چت که می‌توانند توصیه‌هایی ارائه کنند و محصولات را بر اساس اسکرین شات‌ها و ضبط‌های صوتی شناسایی کنند.
دستیارهای دیجیتالی که می توانند به طور همزمان اطلاعات دیداری و صوتی را پردازش کنند و به خدمات و پاسخ های دقیق تری منجر شوند.
شخصیت‌های مجازی و دوستانی که در متاوره خلق شده‌اند، می‌توانند با تعامل با انسان‌ها بیاموزند و در نهایت با مردم به شیوه‌هایی ارتباط برقرار کرده و با آنها گفتگو کنند که به طور فزاینده‌ای احساس می‌شود.
وسایل هوشمندی که می توانند بر اساس نشانه های صوتی و تصویری خود به خود راه اندازی شوند.
قابلیت های خودروی خودمختار پیشرفته که می تواند اشیاء موجود در جاده را به دقت شناسایی کند یا به آژیر پلیس و آمبولانس پاسخ دهد.
فناوری کمکی بهتری که می تواند به راهنمایی افراد مبتلا به اختلالات شنیداری یا بینایی برای بهبود استقلال و تحرک آنها کمک کند.

سوالاتی برای اظهار نظر

این فناوری چگونه می تواند دستگاه های بصری و دستیارهای دیجیتالی بیشتری ایجاد کند؟
چه راه‌هایی وجود دارد که هوش مصنوعی چندوجهی می‌تواند به شما در محل کار کمک کند؟

افزودن به لیست