فرآیندهای یادگیری یکپارچه: یادگیری با نظارت خود در نهایت می تواند سازگار شود
فرآیندهای یادگیری یکپارچه: یادگیری با نظارت خود در نهایت می تواند سازگار شود
فرآیندهای یادگیری یکپارچه: یادگیری با نظارت خود در نهایت می تواند سازگار شود
- نویسنده:
- فوریه 7، 2023
شبکه های عصبی عمیق به طور سنتی در شناسایی اشیاء در عکس ها و فیلم ها و همچنین پردازش زبان طبیعی خوب بوده اند. با این حال، بیشتر تحقیقات پیرامون الگوریتمهای خود نظارتی بر روی روشهای فردی متمرکز شدهاند که میتواند منجر به سوگیری شود.
زمینه فرآیندهای یادگیری یکپارچه
با نظارت خود، رایانه ها می توانند با بررسی آنها و ساختن معنای تصاویر، ضبط های صوتی یا کلمات نوشته شده، در مورد محیط اطراف خود بیاموزند. داشتن ماشین هایی که برای تشخیص تصاویر یا درک زبان گفتاری نیازی به آموزش دستی ندارند کارآمدتر است. بیشتر تحقیقات یادگیری خود نظارت بر یک حوزه به جای چند روش متمرکز است. بنابراین، محققانی که روی یک حوزه تمرکز می کنند، اغلب استراتژی کاملاً متفاوتی با کسانی که روی حوزه دیگری تمرکز می کنند دارند.
به عنوان مثال، در پردازش گفتار، برخی از وظایف یادگیری خود نظارتی دارای واژگان واحدهای گفتاری نیستند. در نتیجه، چندین مدل با مکانیسمهایی ارائه میشوند که فهرستی از واحدهای گفتاری را یاد میگیرند. یادگیری نشانهها، رگرسیون ورودی، یا افزایش دادهها از راههایی هستند که محققان بینایی کامپیوتر در گذشته برای مبارزه با این موضوع تلاش کردهاند. با این حال، اغلب دشوار است که بگوییم آیا این روش ها خارج از زمینه اصلی مؤثر خواهند بود یا خیر.
بر اساس مطالعهای در دانشگاه کرنل در سال ۲۰۲۲، نظریههای برتر در مورد زیستشناسی یادگیری نشان میدهد که انسانها احتمالاً از فرآیندهای مشابهی برای درک تصاویر و زبان استفاده میکنند. به طور مشابه، معماریهای عمومی شبکه عصبی از همتایان خاص مدالیته بهتر عمل کردهاند. به این ترتیب، در سال 2022، متا Data2022vec را معرفی کرد، سیستمی که از یک الگوریتم واحد برای آموزش شبکه عصبی برای تشخیص تصاویر، متن یا گفتار استفاده می کند.
تاثیر مخرب
الگوریتمها تصاویر، متن و صدا را متفاوت پردازش میکنند زیرا واحدهای مجزایی مانند پیکسلها، نشانههای بصری، کلمات یا موجودی صدا را پیشبینی میکنند. ایجاد الگوریتمها مربوط به یک مدالیت خاص است، به این معنی که الگوریتمهایی که در مدالیتههای مختلف هستند، متفاوت از یکدیگر به کار خود ادامه میدهند. Data2vec به مدلها اجازه میدهد تا با تمرکز بر نمایشها، مانند لایههای شبکه عصبی، با انواع ورودیهای مختلف کار کنند. با data2vec، نیازی به پیشبینی نشانههای بصری، عبارات یا صداها نیست.
Data2vec نشان می دهد که یک الگوریتم خودآموز نه تنها می تواند در چندین سناریو به خوبی کار کند، بلکه اغلب بهتر از روش های سنتی تر عمل می کند. این ویژگی میتواند منجر به استفاده گستردهتر از یادگیری خود نظارت شود و ما را به ماشینهای هوش مصنوعی نزدیکتر کند که میتوانند موضوعات پیچیدهای مانند رویدادهای ورزشی یا روشهای مختلف پخت نان را با استفاده از فیلمها، مقالهها و ضبطهای صوتی آموزش دهند.
در مقالهای در سال 2022 که در مجله نیچر منتشر شد، محققان کاربردهای امیدوارکننده یادگیری خود نظارتی را برای توسعه مدلهایی که از مجموعه دادههای چندوجهی استفاده میکنند، برجسته کردند. این مطالعه همچنین برخی از چالشها را در جمعآوری دادههای بیطرفانه برای آموزش آنها، مانند روشهای مورد استفاده در پزشکی و مراقبتهای بهداشتی مورد بحث قرار داد. با یادگیری خود نظارتی، تیم میتوانست ماشینها را با استفاده از دادههای بدون برچسب آموزش دهد. این شاهکار یک نقطه شروع عالی برای هر کار در پزشکی (و فراتر از آن) برای پیش بینی اطلاعات پنهانی است که نمی توان آنها را به وضوح طبقه بندی کرد. در آینده، الگوریتمها قادر خواهند بود ورودیهای باز را بهتر تشخیص دهند و آنها را بدون دخالت انسان با سایر مجموعههای داده مرتبط کنند.
پیامدهای فرآیندهای یادگیری یکپارچه
پیامدهای گسترده تر فرآیندهای یادگیری یکپارچه ممکن است شامل موارد زیر باشد:
- رباتهای چت که میتوانند توصیههایی ارائه کنند و محصولات را بر اساس اسکرین شاتها و ضبطهای صوتی شناسایی کنند.
- دستیارهای دیجیتالی که می توانند به طور همزمان اطلاعات دیداری و صوتی را پردازش کنند و به خدمات و پاسخ های دقیق تری منجر شوند.
- شخصیتهای مجازی و دوستانی که در متاوره خلق شدهاند، میتوانند با تعامل با انسانها بیاموزند و در نهایت با مردم به شیوههایی ارتباط برقرار کرده و با آنها گفتگو کنند که به طور فزایندهای احساس میشود.
- وسایل هوشمندی که می توانند بر اساس نشانه های صوتی و تصویری خود به خود راه اندازی شوند.
- قابلیت های خودروی خودمختار پیشرفته که می تواند اشیاء موجود در جاده را به دقت شناسایی کند یا به آژیر پلیس و آمبولانس پاسخ دهد.
- فناوری کمکی بهتری که می تواند به راهنمایی افراد مبتلا به اختلالات شنیداری یا بینایی برای بهبود استقلال و تحرک آنها کمک کند.
سوالاتی برای اظهار نظر
- این فناوری چگونه می تواند دستگاه های بصری و دستیارهای دیجیتالی بیشتری ایجاد کند؟
- چه راههایی وجود دارد که هوش مصنوعی چندوجهی میتواند به شما در محل کار کمک کند؟
مراجع بینش
پیوندهای محبوب و نهادی زیر برای این بینش ارجاع داده شد: