Quantumrun

VAIZDO KREDITAS:

iStock

Konvoliucinis neuroninis tinklas (CNN): kompiuterių mokymas, kaip matyti

Konvoliuciniai neuroniniai tinklai (CNN) moko dirbtinį intelektą, kad būtų galima geriau atpažinti ir klasifikuoti vaizdus ir garsą.

Autorius:
autoriaus vardas
Quantumrun Foresight
Gruodis 1, 2023

Įžvalgos santrauka

Konvoliuciniai neuroniniai tinklai (CNN) yra pagrindiniai vaizdų klasifikavimo ir kompiuterinio matymo elementai, keičiantys tai, kaip mašinos atpažįsta ir supranta vaizdinius duomenis. Jie imituoja žmogaus regėjimą, apdorodami vaizdus per konvoliuciją, sujungdami ir visiškai sujungtus sluoksnius, kad būtų galima išgauti ir analizuoti funkcijas. CNN yra įvairių pritaikymų, įskaitant mažmeninę prekybą gaminių rekomendacijoms, automobilių saugos patobulinimams, sveikatos priežiūrai auglių aptikimui ir veido atpažinimo technologiją. Jų naudojimas apima dokumentų analizę, genetiką ir palydovinių vaizdų analizę. Vis labiau integruojantis į įvairius sektorius, CNN kelia etinių problemų, ypač susijusių su veido atpažinimo technologijomis ir duomenų privatumu, ir pabrėžia, kad reikia atidžiai apsvarstyti jų diegimą.

Konvoliucinio neuroninio tinklo (CNN) kontekstas

CNN yra gilaus mokymosi modelis, įkvėptas to, kaip žmonės ir gyvūnai naudoja akis objektams identifikuoti. Kompiuteriai šios galimybės neturi; kai jie „žiūri“ vaizdą, jis paverčiamas skaitmenimis. Taigi CNN iš kitų neuroninių tinklų išsiskiria pažangiomis galimybėmis analizuoti vaizdo ir garso signalų duomenis. Jie skirti automatiškai ir adaptyviai išmokti erdvines funkcijų hierarchijas nuo žemo iki aukšto lygio modelių. CNN gali padėti kompiuteriui įgyti „žmogaus“ akis ir suteikti jam kompiuterinį regėjimą, leidžiantį absorbuoti visus matomus pikselius ir skaičius bei padėti atpažinti ir klasifikuoti vaizdą.

„ConvNets“ įdiegia aktyvinimo funkcijas funkcijų žemėlapyje, kad padėtų įrenginiui nustatyti, ką jis mato. Šį procesą įgalina trys pagrindiniai sluoksniai: konvoliucijos, telkimo ir visiškai sujungti sluoksniai. Pirmieji du (konvoliucinis ir kaupimas) atlieka duomenų išgavimą, o visiškai prijungtas sluoksnis generuoja išvestį, pvz., klasifikavimą. Objektų žemėlapis perkeliamas iš vieno sluoksnio į sluoksnį, kol kompiuteris gali matyti visą vaizdą. CNN suteikiama kuo daugiau informacijos, kad būtų galima aptikti skirtingas charakteristikas. Liepdami kompiuteriams ieškoti kraštų ir linijų, šios mašinos išmoksta greitai ir tiksliai atpažinti vaizdus žmonėms neįmanomu greičiu.

Trikdantis poveikis

Nors CNN dažniausiai naudojami vaizdų atpažinimo ir klasifikavimo užduotims atlikti, jie taip pat gali būti naudojami aptikimui ir segmentavimui. Pavyzdžiui, mažmeninėje prekyboje CNN gali vizualiai ieškoti, kad nustatytų ir rekomenduotų daiktus, kurie papildo esamą drabužių spintą. Automobiliuose šie tinklai gali stebėti kelio sąlygų pokyčius, pvz., eismo juostų linijos aptikimą, kad pagerintų saugumą. Sveikatos priežiūros srityje CNN naudojami siekiant geriau identifikuoti vėžinius navikus, segmentuojant šias pažeistas ląsteles iš aplinkinių sveikų organų. Tuo tarpu CNN patobulino veido atpažinimo technologiją, leidžiančią socialinės žiniasklaidos platformoms atpažinti žmones nuotraukose ir pateikti žymėjimo rekomendacijas. (Tačiau „Facebook“ nusprendė sustabdyti šią funkciją 2021 m., nurodydama didėjančius etinius susirūpinimą ir neaiškią reguliavimo politiką dėl šios technologijos naudojimo).

Dokumentų analizė taip pat gali patobulinti naudojant CNN. Jie gali patikrinti ranka parašytą kūrinį, palyginti jį su ranka rašyto turinio duomenų baze, interpretuoti žodžius ir kt. Jie gali nuskaityti ranka rašytus dokumentus, kurie yra svarbūs bankininkystei ir finansams arba dokumentų klasifikavimui muziejams. Genetikos srityje šie tinklai gali įvertinti ląstelių kultūras ligų tyrimams tirdami nuotraukas ir žemėlapius bei nuspėjamąją analizę, kad padėtų medicinos ekspertams kurti galimus gydymo būdus. Galiausiai, konvoliuciniai sluoksniai gali padėti suskirstyti palydovinius vaizdus į kategorijas ir greitai nustatyti, kas jie yra, o tai gali padėti tyrinėti kosmosą.

Konvoliucinio neuroninio tinklo (CNN) taikymas

Kai kurios konvoliucinio neuroninio tinklo (CNN) programos gali apimti:

Didesnis naudojimas sveikatos priežiūros diagnozėms, įskaitant radiologiją, rentgeno spindulius ir genetines ligas.
CNN naudojimas siekiant klasifikuoti srautinius vaizdus iš erdvėlaivių ir stočių bei mėnulio roverių. Gynybos agentūros gali taikyti CNN stebėjimo palydovams ir bepiločiams orlaiviams, kad galėtų savarankiškai nustatyti ir įvertinti saugumo ar karines grėsmes.
Patobulinta optinė simbolių atpažinimo technologija, skirta ranka rašytiems tekstams ir vaizdų atpažinimui.
Patobulintos robotų rūšiavimo programos sandėliuose ir perdirbimo įmonėse.
Jų naudojimas klasifikuojant nusikaltėlius ir dominančius asmenis iš miesto ar vidaus stebėjimo kamerų. Tačiau šis metodas gali būti šališkas.
Daugiau įmonių klausiama dėl veido atpažinimo technologijos naudojimo, įskaitant tai, kaip jos renka ir naudoja duomenis.

Klausimai komentuoti

Kaip dar, jūsų nuomone, CNN gali pagerinti kompiuterinį regėjimą ir kaip mes juo naudojame kasdien?
Kokie kiti galimi geresnio vaizdų atpažinimo ir klasifikavimo pranašumai?

Pridėti į sąrašą