卷積神經網路 (CNN):教導電腦如何觀察

圖片來源:
圖片來源
iStock

卷積神經網路 (CNN):教導電腦如何觀察

卷積神經網路 (CNN):教導電腦如何觀察

副標題文字
卷積神經網路 (CNN) 正在訓練人工智慧以更好地識別和分類影像和音訊。
    • 作者:
    • 作者姓名
      量子運行遠見
    • 2023 年 12 月 1 日

    洞察總結



    卷積神經網路 (CNN) 在影像分類和電腦視覺中起著關鍵作用,它改變了機器識別和理解視覺資料的方式。它們模仿人類視覺,透過卷積、池化和全連接層處理影像以進行特徵提取和分析。 CNN 有多種應用,包括零售業的產品推薦、汽車業的安全改進、醫療保健業的腫瘤檢測以及臉部辨識技術。它們的用途擴展到文件分析、遺傳學和衛星圖像分析。隨著 CNN 日益融入各個領域,其引發了道德方面的擔憂,尤其是在臉部辨識技術和資料隱私方面,凸顯了對其部署進行謹慎考慮的必要性。



    卷積神經網路(CNN)背景



    CNN 是一種深度學習模型,其靈感來自人類和動物如何使用眼睛來識別物體。計算機不具備這種能力;當他們「查看」影像時,影像會被轉換成數位。因此,CNN 與其他神經網路的差異在於其分析影像和音訊訊號資料的先進能力。它們旨在自動、自適應地學習特徵的空間層次結構,從低階到高階模式。 CNN 可以幫助電腦獲得「人類」眼睛並為其提供電腦視覺,使其吸收所看到的所有像素和數字,並有助於圖像識別和分類。 



    ConvNets 在特徵圖中實現激活函數來幫助機器確定它所看到的內容。此過程由三個主要層實現:卷積層、池化層和全連接層。前兩個(卷積和池化)執行資料擷取,而全連接層產生輸出,例如分類。特徵圖被一層層地傳遞,直到電腦能夠看到整個影像。 CNN 會獲得盡可能多的信息來檢測不同的特徵。透過讓電腦尋找邊緣和線條,這些機器學會如何以人類無法達到的速度快速且準確地辨識影像。



    破壞性影響



    雖然 CNN 最常用於影像辨識和分類任務,但它們也可以用於檢測和分割。例如,在零售業中,CNN 可以透過視覺搜尋來識別和推薦與現有衣櫃相匹配的物品。在汽車領域,這些網路可以監測道路狀況的變化,例如車道線偵測,以提高安全性。在醫療保健領域,CNN 透過將受損細胞與周圍的健康器官分離,可以更好地識別癌性腫瘤。同時,CNN 改進了臉部辨識技術,使社群媒體平台能夠識別照片中的人物並給予標記建議。 (然而,Facebook 已決定在 2021 年停止該功能,理由是道德問題日益嚴重,且使用該技術的監管政策不明確)。 



    文檔分析也可以透過 CNN 得到改進。他們可以驗證手寫作品,將其與手寫內容資料庫進行比較,解釋文字等等。他們可能會掃描對銀行和金融至關重要的手寫文件或博物館的文件分類。在遺傳學中,這些網絡可以透過檢查圖片、映射和預測分析來評估疾病研究的細胞培養物,以協助醫學專家開發潛在的治療方法。最後,卷積層可能有助於對衛星影像進行分類並快速識別它們是什麼,這有助於太空探索。



    卷積神經網路(CNN)的應用



    卷積神經網路(CNN)的一些應用可能包括: 




    • 在醫療診斷中的應用日益增多,包括放射學、X 光和遺傳疾病。

    • 使用 CNN 對來自太空梭、太空站和月球探測器的流圖像進行分類。國防機構可以將 CNN 應用於監視衛星和無人機,以自主識別和評估安全或軍事威脅。

    • 改進的光學字元辨識技術,用於手寫文字和圖像辨識。

    • 改善倉庫和回收設施中的機器人分類應用。

    • 它們用於根據城市或室內監視器對罪犯和嫌疑人進行分類。然而,這種方法可能會產生偏差。

    • 越來越多的公司受到有關其使用臉部辨識技術的質疑,包括他們如何收集和使用數據。



    要評論的問題




    • 您認為 CNN 還能如何改善電腦視覺以及我們如何日常使​​用它?

    • 更好的影像辨識和分類還可能帶來哪些好處?


    洞察參考

    此見解引用了以下流行和機構鏈接: