Rede neural convolucional (CNN): ensinando computadores a ver

CRÉDITO DE IMAGEM:
Crédito da imagem
iStock

Rede neural convolucional (CNN): ensinando computadores a ver

Rede neural convolucional (CNN): ensinando computadores a ver

Texto do subtítulo
As redes neurais convolucionais (CNNs) estão treinando IA para melhor identificar e classificar imagens e áudio.
    • Autor:
    • Nome do autor
      Previsão Quantumrun
    • 1 de dezembro de 2023

    Resumo do insight

    Redes Neurais Convolucionais (CNNs) são fundamentais na classificação de imagens e visão computacional, transformando a forma como as máquinas identificam e entendem dados visuais. Eles imitam a visão humana, processando imagens por meio de camadas convolucionais, agrupadas e totalmente conectadas para extração e análise de recursos. As CNNs têm diversas aplicações, incluindo varejo para recomendações de produtos, automotivo para melhorias de segurança, saúde para detecção de tumores e tecnologia de reconhecimento facial. Seu uso se estende à análise de documentos, genética e análise de imagens de satélite. Com a sua crescente integração em vários setores, as CNNs levantam preocupações éticas, especialmente no que diz respeito à tecnologia de reconhecimento facial e à privacidade de dados, destacando a necessidade de uma consideração cuidadosa da sua implantação.

    Contexto da rede neural convolucional (CNN)

    CNNs são um modelo de aprendizagem profunda inspirado na forma como humanos e animais usam seus olhos para identificar objetos. Os computadores não possuem esse recurso; quando “visualizam” uma imagem, ela é traduzida em dígitos. Assim, as CNNs se distinguem de outras redes neurais por suas capacidades avançadas de análise de dados de sinais de imagem e áudio. Eles são projetados para aprender hierarquias espaciais de recursos de forma automática e adaptativa, de padrões de baixo a alto nível. As CNNs podem ajudar um computador a adquirir olhos “humanos” e fornecer-lhe visão computacional, permitindo-lhe absorver todos os pixels e números que vê e ajudar no reconhecimento e classificação de imagens. 

    ConvNets implementam funções de ativação em um mapa de recursos para ajudar a máquina a determinar o que vê. Este processo é possibilitado por três camadas principais: a convolucional, o pooling e as camadas totalmente conectadas. As duas primeiras (convolucional e pooling) realizam a extração de dados, enquanto a camada totalmente conectada gera saída, como classificação. O mapa de recursos é transferido de camada para camada até que o computador possa ver a imagem inteira. As CNNs recebem o máximo de informações possível para detectar diferentes características. Ao dizer aos computadores para procurarem bordas e linhas, essas máquinas aprendem como identificar imagens com rapidez e precisão em taxas impossíveis para os humanos.

    Impacto disruptivo

    Embora as CNNs sejam mais comumente usadas para tarefas de reconhecimento e classificação de imagens, elas também podem ser usadas para detecção e segmentação. Por exemplo, no varejo, as CNNs podem pesquisar visualmente para identificar e recomendar itens que complementem um guarda-roupa existente. No setor automotivo, essas redes podem estar atentas às mudanças nas condições das estradas, como a detecção de linhas de faixa, para melhorar a segurança. Na área da saúde, as CNNs são usadas para identificar melhor os tumores cancerígenos, segmentando essas células danificadas dos órgãos saudáveis ​​ao seu redor. Enquanto isso, as CNNs melhoraram a tecnologia de reconhecimento facial, permitindo que as plataformas de mídia social identifiquem pessoas nas fotos e forneçam recomendações de marcação. (No entanto, o Facebook decidiu interromper esse recurso em 2021, citando preocupações éticas crescentes e políticas regulatórias pouco claras sobre o uso desta tecnologia). 

    A análise de documentos também pode melhorar com as CNNs. Eles podem verificar um trabalho manuscrito, compará-lo com um banco de dados de conteúdo manuscrito, interpretar as palavras e muito mais. Eles podem digitalizar documentos manuscritos essenciais para serviços bancários e financeiros ou classificação de documentos para museus. Na genética, estas redes podem avaliar culturas celulares para investigação de doenças, examinando imagens e mapeamento e análises preditivas para ajudar os especialistas médicos no desenvolvimento de potenciais tratamentos. Finalmente, as camadas convolucionais podem auxiliar na categorização de imagens de satélite e na rápida identificação do que são, o que pode ajudar na exploração espacial.

    Aplicações de rede neural convolucional (CNN)

    Algumas aplicações de rede neural convolucional (CNN) podem incluir: 

    • Aumento do uso em diagnósticos de saúde, incluindo radiologia, raios X e doenças genéticas.
    • O uso de CNNs para classificar imagens transmitidas de ônibus e estações espaciais e rovers lunares. As agências de defesa podem aplicar CNNs a satélites de vigilância e drones para identificação e avaliação autônoma de ameaças militares ou de segurança.
    • Tecnologia aprimorada de reconhecimento óptico de caracteres para textos manuscritos e reconhecimento de imagens.
    • Aplicações aprimoradas de classificação robótica em armazéns e instalações de reciclagem.
    • Sua utilização na classificação de criminosos e pessoas de interesse a partir de câmeras de vigilância urbana ou interna. No entanto, este método pode estar sujeito a preconceitos.
    • Mais empresas estão sendo questionadas sobre o uso da tecnologia de reconhecimento facial, incluindo como coletam e usam os dados.

    Perguntas para comentar

    • De que outra forma você acha que as CNNs podem melhorar a visão computacional e como a usamos diariamente?
    • Quais são os outros possíveis benefícios de um melhor reconhecimento e classificação de imagens?

    Referências de insights

    Os seguintes links populares e institucionais foram referenciados para esta percepção:

    Universidade dos Governadores Ocidentais O que é uma rede neural convolucional? | 3 de agosto de 2020