Quantumrun

KREDIT GAMBAR:

iStock

Rangkaian saraf konvolusi (CNN): Mengajar komputer cara melihat

Rangkaian saraf konvolusi (CNN) sedang melatih AI untuk mengenal pasti dan mengklasifikasikan imej dan audio dengan lebih baik.

Pengarang
Nama pengarang
Quantumrun Foresight
Disember 1, 2023

Ringkasan cerapan

Rangkaian Neural Konvolusi (CNN) adalah penting dalam klasifikasi imej dan penglihatan komputer, mengubah cara mesin mengenal pasti dan memahami data visual. Mereka meniru penglihatan manusia, memproses imej melalui lapisan konvolusi, pengumpulan dan bersambung sepenuhnya untuk pengekstrakan dan analisis ciri. CNN mempunyai pelbagai aplikasi, termasuk runcit untuk cadangan produk, automotif untuk peningkatan keselamatan, penjagaan kesihatan untuk pengesanan tumor dan teknologi pengecaman muka. Penggunaannya meluas kepada analisis dokumen, genetik, dan menganalisis imejan satelit. Dengan peningkatan integrasi mereka ke dalam pelbagai sektor, CNN menimbulkan kebimbangan etika, terutamanya mengenai teknologi pengecaman muka dan privasi data, menonjolkan keperluan untuk pertimbangan yang teliti terhadap penggunaan mereka.

Konteks rangkaian neural convolutional (CNN).

CNN ialah model pembelajaran mendalam yang diilhamkan oleh cara manusia dan haiwan menggunakan mata mereka untuk mengenal pasti objek. Komputer tidak mempunyai keupayaan ini; apabila mereka "melihat" imej, ia diterjemahkan ke dalam digit. Oleh itu, CNN dibezakan daripada rangkaian saraf lain dengan keupayaan lanjutan mereka untuk menganalisis data isyarat imej dan audio. Mereka direka bentuk untuk mempelajari hierarki spatial ciri secara automatik dan adaptif, daripada corak peringkat rendah hingga tinggi. CNN boleh membantu komputer dalam memperoleh mata "manusia" dan menyediakannya dengan penglihatan komputer, membolehkannya menyerap semua piksel dan nombor yang dilihatnya dan membantu dalam pengecaman dan pengelasan imej.

ConvNets melaksanakan fungsi pengaktifan dalam peta ciri untuk membantu mesin dalam menentukan perkara yang dilihatnya. Proses ini didayakan oleh tiga lapisan utama: lapisan konvolusi, pengumpulan dan lapisan bersambung sepenuhnya. Dua yang pertama (konvolusi dan pengumpulan) melakukan pengekstrakan data, manakala lapisan yang disambungkan sepenuhnya menjana output, seperti pengelasan. Peta ciri dipindahkan dari lapisan ke lapisan sehingga komputer dapat melihat keseluruhan gambar. CNN diberi maklumat sebanyak mungkin untuk mengesan ciri-ciri yang berbeza. Dengan memberitahu komputer untuk mencari tepi dan garisan, mesin ini belajar cara mengenal pasti imej dengan pantas dan tepat pada kadar yang mustahil untuk manusia.

Kesan yang mengganggu

Walaupun CNN paling biasa digunakan untuk tugas pengecaman dan pengelasan imej, ia juga boleh digunakan untuk pengesanan dan pembahagian. Contohnya, dalam runcit, CNN boleh mencari secara visual untuk mengenal pasti dan mengesyorkan item yang melengkapkan almari pakaian sedia ada. Dalam automotif, rangkaian ini boleh memerhatikan perubahan dalam keadaan jalan seperti pengesanan garisan lorong untuk meningkatkan keselamatan. Dalam penjagaan kesihatan, CNN digunakan untuk mengenal pasti tumor kanser dengan lebih baik dengan membahagikan sel yang rosak ini daripada organ yang sihat di sekelilingnya. Sementara itu, CNN telah mempertingkatkan teknologi pengecaman muka, membolehkan platform media sosial mengenal pasti orang dalam foto dan memberikan pengesyoran penandaan. (Bagaimanapun, Facebook telah memutuskan untuk menghentikan ciri ini pada tahun 2021, memetik kebimbangan etika yang semakin meningkat dan dasar kawal selia yang tidak jelas mengenai penggunaan teknologi ini).

Analisis dokumen juga boleh bertambah baik dengan CNN. Mereka boleh mengesahkan karya tulisan tangan, membandingkannya dengan pangkalan data kandungan tulisan tangan, mentafsir perkataan dan banyak lagi. Mereka mungkin mengimbas kertas tulisan tangan yang penting untuk perbankan dan kewangan atau klasifikasi dokumen untuk muzium. Dalam genetik, rangkaian ini boleh menilai kultur sel untuk penyelidikan penyakit dengan memeriksa gambar dan pemetaan dan analitik ramalan untuk membantu pakar perubatan dalam membangunkan rawatan yang berpotensi. Akhir sekali, lapisan konvolusi boleh membantu dalam mengkategorikan imej satelit dan mengenal pasti dengan pantas apa itu, yang boleh membantu dalam penerokaan angkasa lepas.

Aplikasi rangkaian neural convolutional (CNN)

Beberapa aplikasi rangkaian neural convolutional (CNN) mungkin termasuk:

Peningkatan penggunaan dalam diagnosis penjagaan kesihatan, termasuk radiologi, x-ray dan penyakit genetik.
Penggunaan CNN untuk mengklasifikasikan imej yang distrim dari angkasa lepas dan stesen, dan pengembara bulan. Agensi pertahanan boleh menggunakan CNN untuk mengawasi satelit dan dron untuk pengenalpastian autonomi dan penilaian keselamatan atau ancaman ketenteraan.
Teknologi pengecaman aksara optik yang dipertingkatkan untuk teks tulisan tangan dan pengecaman imej.
Aplikasi pengisihan robot yang lebih baik di gudang dan kemudahan kitar semula.
Penggunaannya dalam mengklasifikasikan penjenayah dan orang yang berkepentingan daripada kamera pengawasan bandar atau dalaman. Walau bagaimanapun, kaedah ini boleh tertakluk kepada berat sebelah.
Lebih banyak syarikat dipersoalkan tentang penggunaan teknologi pengecaman muka mereka, termasuk cara mereka mengumpul dan menggunakan data.

Soalan untuk diulas

Bagaimana lagi pada pendapat anda CNN boleh meningkatkan penglihatan komputer dan cara kami menggunakannya setiap hari?
Apakah faedah lain yang mungkin dari pengecaman dan pengelasan imej yang lebih baik?

Tambah ke senarai