Proses pembelajaran terpadu: Pembelajaran yang diawasi sendiri akhirnya bisa menjadi konsisten

KREDIT GAMBAR:
Gambar kredit
iStock

Proses pembelajaran terpadu: Pembelajaran yang diawasi sendiri akhirnya bisa menjadi konsisten

Proses pembelajaran terpadu: Pembelajaran yang diawasi sendiri akhirnya bisa menjadi konsisten

Teks subjudul
Para peneliti akhirnya menemukan cara untuk melatih algoritme melalui satu masukan terlepas dari jenis atau format data.
    • Penulis:
    • nama penulis
      Pandangan ke Depan Quantumrun
    • Februari 7, 2023

    Jaringan saraf yang dalam secara tradisional bagus dalam mengidentifikasi objek dalam foto dan video, serta memproses bahasa alami. Namun, sebagian besar penelitian seputar algoritme yang diawasi sendiri berkonsentrasi pada modalitas individu, yang dapat menyebabkan bias.

    Konteks proses pembelajaran terpadu

    Dengan swa-pengawasan, komputer dapat belajar tentang lingkungannya dengan memeriksanya dan menyusun makna gambar, rekaman audio, atau kata-kata tertulis. Lebih efisien memiliki mesin yang tidak memerlukan instruksi manual untuk membedakan gambar atau memahami bahasa lisan. Sebagian besar penelitian pembelajaran dengan pengawasan sendiri berfokus pada satu area daripada beberapa modalitas. Oleh karena itu, peneliti yang berfokus pada satu bidang seringkali memiliki strategi yang sama sekali berbeda dengan yang berfokus pada bidang lain.

    Misalnya, dalam pemrosesan ucapan, beberapa tugas pembelajaran yang diawasi sendiri tidak memiliki kosa kata unit ucapan. Akibatnya, beberapa model hadir dengan mekanisme yang mempelajari inventarisasi unit ucapan. Mempelajari token, meregresi input, atau membuat augmentasi data adalah beberapa cara yang telah dicoba oleh para peneliti visi komputer untuk mengatasi masalah ini di masa lalu. Namun, seringkali sulit untuk mengetahui apakah metode ini akan efektif di luar konteks aslinya.

    Menurut sebuah studi Universitas Cornell tahun 2022, teori teratas tentang biologi pembelajaran menunjukkan bahwa manusia kemungkinan besar menggunakan proses serupa untuk memahami visual dan bahasa. Demikian pula, arsitektur jaringan saraf umum telah mengungguli mitra khusus modalitas. Dengan demikian, pada tahun 2022, Meta memperkenalkan Data2vec, sebuah sistem yang menggunakan algoritme tunggal untuk melatih jaringan saraf untuk mengenali gambar, teks, atau ucapan. 

    Dampak yang mengganggu

    Algoritma memproses gambar, teks, dan suara secara berbeda karena mereka mengantisipasi unit yang berbeda seperti piksel, token visual, kata, atau inventaris suara. Penciptaan algoritma terkait dengan modalitas tertentu, artinya modalitas yang berbeda akan terus bekerja secara berbeda satu sama lain. Data2vec memungkinkan model untuk beroperasi dengan berbagai jenis input dengan berfokus pada representasi, seperti lapisan jaringan saraf. Dengan data2vec, tidak perlu memprediksi token visual, frasa, atau suara.

    Data2vec menunjukkan bahwa algoritme otodidak tidak hanya dapat bekerja dengan baik di berbagai skenario, tetapi seringkali lebih baik daripada metode yang lebih tradisional. Fitur ini dapat mengarah pada penggunaan pembelajaran mandiri yang lebih luas dan membawa kita lebih dekat ke mesin AI yang dapat belajar sendiri tentang topik kompleks seperti acara olahraga atau berbagai cara memanggang roti menggunakan film, artikel, dan rekaman audio.

    Dalam makalah tahun 2022 yang diterbitkan di jurnal Nature, para peneliti menyoroti aplikasi yang menjanjikan dari pembelajaran mandiri untuk mengembangkan model yang menggunakan kumpulan data multimodal. Studi ini juga membahas beberapa tantangan dalam mengumpulkan data yang tidak bias untuk pelatihan mereka, seperti metode yang digunakan dalam pengobatan dan perawatan kesehatan. Dengan pembelajaran yang diawasi sendiri, tim dapat mengajar mesin hanya dengan menggunakan data yang tidak berlabel. Prestasi ini adalah titik awal yang bagus untuk tugas apa pun di dalam kedokteran (dan seterusnya) untuk memprediksi informasi tersembunyi yang tidak dapat dikategorikan dengan jelas. Di masa mendatang, algoritme akan dapat mengenali masukan terbuka dengan lebih baik dan menghubungkannya dengan kumpulan data lain tanpa campur tangan manusia.

    Implikasi dari proses pembelajaran terpadu

    Implikasi yang lebih luas dari proses pembelajaran terpadu dapat mencakup: 

    • Chatbot yang dapat membuat rekomendasi dan mengidentifikasi produk berdasarkan tangkapan layar dan rekaman suara.
    • Asisten digital yang dapat memproses informasi visual dan audio secara bersamaan, menghasilkan layanan dan respons yang lebih akurat.
    • Karakter dan teman virtual dibuat dalam metaverse yang dapat belajar dengan berinteraksi dengan manusia dan akhirnya terlibat dan berkomunikasi dengan orang-orang dengan cara yang terasa semakin hidup. 
    • Peralatan pintar yang dapat memulai sendiri berdasarkan isyarat audio dan visual.
    • Peningkatan kemampuan kendaraan otonom yang dapat secara akurat mengidentifikasi objek di jalan atau merespons dengan tepat sirene polisi dan ambulans.
    • Teknologi asistif yang lebih baik yang dapat membantu memandu orang dengan gangguan audio atau visual untuk meningkatkan kemandirian dan mobilitas mereka.

    Pertanyaan untuk dikomentari

    • Bagaimana lagi teknologi ini dapat menciptakan perangkat dan asisten digital yang lebih intuitif?
    • Apa saja cara lain AI multimodal dapat membantu Anda di tempat kerja?