Xarxa neuronal convolucional (CNN): ensenyar als ordinadors a veure

CRÈDIT DE LA IMATGE:
Crèdit d'imatge
iStock

Xarxa neuronal convolucional (CNN): ensenyar als ordinadors a veure

Xarxa neuronal convolucional (CNN): ensenyar als ordinadors a veure

Text del subtítol
Les xarxes neuronals convolucionals (CNN) estan entrenant la IA per identificar i classificar millor les imatges i l'àudio.
    • autor:
    • nom de l'autor
      Previsió de Quantumrun
    • Desembre 1, 2023

    Resum d'informació



    Les xarxes neuronals convolucionals (CNN) són fonamentals en la classificació d'imatges i la visió per ordinador, transformant la manera com les màquines identifiquen i entenen les dades visuals. Imiten la visió humana, processant imatges mitjançant capes convolucionals, agrupades i completament connectades per a l'extracció i anàlisi de característiques. Les CNN tenen aplicacions diverses, com ara la venda al detall per a recomanacions de productes, l'automoció per millorar la seguretat, l'assistència sanitària per a la detecció de tumors i la tecnologia de reconeixement facial. El seu ús s'estén a l'anàlisi de documents, la genètica i l'anàlisi d'imatges de satèl·lit. Amb la seva creixent integració en diversos sectors, les CNN plantegen preocupacions ètiques, especialment pel que fa a la tecnologia de reconeixement facial i la privadesa de les dades, posant de manifest la necessitat de considerar acuradament el seu desplegament.



    Context de la xarxa neuronal convolucional (CNN).



    Les CNN són un model d'aprenentatge profund inspirat en com els humans i els animals utilitzen els seus ulls per identificar objectes. Els ordinadors no tenen aquesta capacitat; quan "veuen" una imatge, es tradueix a dígits. Així, les CNN es distingeixen d'altres xarxes neuronals per les seves capacitats avançades per analitzar dades d'imatge i senyal d'àudio. Estan dissenyats per aprendre de manera automàtica i adaptativa jerarquies espacials de característiques, des de patrons de baix a alt nivell. Les CNN poden ajudar un ordinador a adquirir ulls "humans" i proporcionar-li visió per ordinador, cosa que li permet absorbir tots els píxels i números que veu i ajudar en el reconeixement i la classificació d'imatges. 



    ConvNets implementen funcions d'activació en un mapa de funcions per ajudar la màquina a determinar què veu. Aquest procés està habilitat per tres capes principals: la convolucional, la d'agrupació i les capes totalment connectades. Els dos primers (convolucional i agrupació) realitzen l'extracció de dades, mentre que la capa totalment connectada genera resultats, com ara la classificació. El mapa de característiques es transfereix de capa a capa fins que l'ordinador pot veure la imatge sencera. Les CNN reben la màxima informació possible per detectar diferents característiques. En dir als ordinadors que cerquin vores i línies, aquestes màquines aprenen a identificar imatges de manera ràpida i precisa a ritmes impossibles per als humans.



    Impacte disruptiu



    Tot i que les CNN s'utilitzen més habitualment per a tasques de reconeixement i classificació d'imatges, també es poden utilitzar per a la detecció i la segmentació. Per exemple, a la venda al detall, les CNN poden cercar visualment per identificar i recomanar articles que complementin un armari existent. A l'automoció, aquestes xarxes poden vigilar els canvis en les condicions de la carretera com la detecció de línies de carril per millorar la seguretat. A l'assistència sanitària, les CNN s'utilitzen per identificar millor els tumors cancerosos segmentant aquestes cèl·lules danyades dels òrgans sans que els envolten. Mentrestant, les CNN han millorat la tecnologia de reconeixement facial, permetent a les plataformes de xarxes socials identificar persones a les fotos i donar recomanacions d'etiquetatge. (No obstant això, Facebook ha decidit aturar aquesta funció el 2021, citant preocupacions ètiques creixents i polítiques reguladores poc clares sobre l'ús d'aquesta tecnologia). 



    L'anàlisi de documents també pot millorar amb les CNN. Poden verificar una obra manuscrita, comparar-la amb una base de dades de contingut escrit a mà, interpretar les paraules i molt més. Poden escanejar documents escrits a mà crítics per a la banca i les finances o la classificació de documents per als museus. En genètica, aquestes xarxes poden avaluar cultius cel·lulars per a la investigació de malalties examinant imatges i mapes i anàlisis predictives per ajudar els experts mèdics a desenvolupar tractaments potencials. Finalment, les capes convolucionals poden ajudar a categoritzar les imatges de satèl·lit i identificar ràpidament quines són, cosa que pot ajudar a l'exploració espacial.



    Aplicacions de la xarxa neuronal convolucional (CNN)



    Algunes aplicacions de la xarxa neuronal convolucional (CNN) poden incloure: 




    • Augment de l'ús en diagnòstics sanitaris, incloent radiologia, raigs X i malalties genètiques.

    • L'ús de CNN per classificar imatges transmeses des de transbordadors i estacions espacials i vehicles mòbils lunars. Les agències de defensa poden aplicar CNN a satèl·lits de vigilància i drons per a la identificació i avaluació autònoma de les amenaces de seguretat o militars.

    • Tecnologia de reconeixement òptic de caràcters millorada per a textos escrits a mà i reconeixement d'imatges.

    • Aplicacions de classificació robòtica millorades en magatzems i instal·lacions de reciclatge.

    • El seu ús per classificar delinqüents i persones d'interès des de càmeres de vigilància urbana o interior. Tanmateix, aquest mètode pot estar subjecte a biaixos.

    • Es qüestiona més empreses sobre el seu ús de la tecnologia de reconeixement facial, inclosa la manera com estan recopilant i utilitzant les dades.



    Preguntes per comentar




    • De quina altra manera creus que les CNN poden millorar la visió per ordinador i com l'utilitzem diàriament?

    • Quins són els altres possibles beneficis d'un millor reconeixement i classificació d'imatges?


    Referències insight

    Es va fer referència als següents enllaços populars i institucionals per a aquesta visió: