Rede neural convolucional (CNN): ensinando computadores a ver
Rede neural convolucional (CNN): ensinando computadores a ver
Rede neural convolucional (CNN): ensinando computadores a ver
- Autor:
- 1 de dezembro de 2023
Resumo do insight
Redes Neurais Convolucionais (CNNs) são fundamentais na classificação de imagens e visão computacional, transformando a forma como as máquinas identificam e entendem dados visuais. Eles imitam a visão humana, processando imagens por meio de camadas convolucionais, agrupadas e totalmente conectadas para extração e análise de recursos. As CNNs têm diversas aplicações, incluindo varejo para recomendações de produtos, automotivo para melhorias de segurança, saúde para detecção de tumores e tecnologia de reconhecimento facial. Seu uso se estende à análise de documentos, genética e análise de imagens de satélite. Com a sua crescente integração em vários setores, as CNNs levantam preocupações éticas, especialmente no que diz respeito à tecnologia de reconhecimento facial e à privacidade de dados, destacando a necessidade de uma consideração cuidadosa da sua implantação.
Contexto da rede neural convolucional (CNN)
CNNs são um modelo de aprendizagem profunda inspirado na forma como humanos e animais usam seus olhos para identificar objetos. Os computadores não possuem esse recurso; quando “visualizam” uma imagem, ela é traduzida em dígitos. Assim, as CNNs se distinguem de outras redes neurais por suas capacidades avançadas de análise de dados de sinais de imagem e áudio. Eles são projetados para aprender hierarquias espaciais de recursos de forma automática e adaptativa, de padrões de baixo a alto nível. As CNNs podem ajudar um computador a adquirir olhos “humanos” e fornecer-lhe visão computacional, permitindo-lhe absorver todos os pixels e números que vê e ajudar no reconhecimento e classificação de imagens.
ConvNets implementam funções de ativação em um mapa de recursos para ajudar a máquina a determinar o que vê. Este processo é possibilitado por três camadas principais: a convolucional, o pooling e as camadas totalmente conectadas. As duas primeiras (convolucional e pooling) realizam a extração de dados, enquanto a camada totalmente conectada gera saída, como classificação. O mapa de recursos é transferido de camada para camada até que o computador possa ver a imagem inteira. As CNNs recebem o máximo de informações possível para detectar diferentes características. Ao dizer aos computadores para procurarem bordas e linhas, essas máquinas aprendem como identificar imagens com rapidez e precisão em taxas impossíveis para os humanos.
Impacto disruptivo
Embora as CNNs sejam mais comumente usadas para tarefas de reconhecimento e classificação de imagens, elas também podem ser usadas para detecção e segmentação. Por exemplo, no varejo, as CNNs podem pesquisar visualmente para identificar e recomendar itens que complementem um guarda-roupa existente. No setor automotivo, essas redes podem estar atentas às mudanças nas condições das estradas, como a detecção de linhas de faixa, para melhorar a segurança. Na área da saúde, as CNNs são usadas para identificar melhor os tumores cancerígenos, segmentando essas células danificadas dos órgãos saudáveis ao seu redor. Enquanto isso, as CNNs melhoraram a tecnologia de reconhecimento facial, permitindo que as plataformas de mídia social identifiquem pessoas nas fotos e forneçam recomendações de marcação. (No entanto, o Facebook decidiu interromper esse recurso em 2021, citando preocupações éticas crescentes e políticas regulatórias pouco claras sobre o uso desta tecnologia).
A análise de documentos também pode melhorar com as CNNs. Eles podem verificar um trabalho manuscrito, compará-lo com um banco de dados de conteúdo manuscrito, interpretar as palavras e muito mais. Eles podem digitalizar documentos manuscritos essenciais para serviços bancários e financeiros ou classificação de documentos para museus. Na genética, estas redes podem avaliar culturas celulares para investigação de doenças, examinando imagens e mapeamento e análises preditivas para ajudar os especialistas médicos no desenvolvimento de potenciais tratamentos. Finalmente, as camadas convolucionais podem auxiliar na categorização de imagens de satélite e na rápida identificação do que são, o que pode ajudar na exploração espacial.
Aplicações de rede neural convolucional (CNN)
Algumas aplicações de rede neural convolucional (CNN) podem incluir:
- Aumento do uso em diagnósticos de saúde, incluindo radiologia, raios X e doenças genéticas.
- O uso de CNNs para classificar imagens transmitidas de ônibus e estações espaciais e rovers lunares. As agências de defesa podem aplicar CNNs a satélites de vigilância e drones para identificação e avaliação autônoma de ameaças militares ou de segurança.
- Tecnologia aprimorada de reconhecimento óptico de caracteres para textos manuscritos e reconhecimento de imagens.
- Aplicações aprimoradas de classificação robótica em armazéns e instalações de reciclagem.
- Sua utilização na classificação de criminosos e pessoas de interesse a partir de câmeras de vigilância urbana ou interna. No entanto, este método pode estar sujeito a preconceitos.
- Mais empresas estão sendo questionadas sobre o uso da tecnologia de reconhecimento facial, incluindo como coletam e usam os dados.
Perguntas para comentar
- De que outra forma você acha que as CNNs podem melhorar a visão computacional e como a usamos diariamente?
- Quais são os outros possíveis benefícios de um melhor reconhecimento e classificação de imagens?
Referências de insights
Os seguintes links populares e institucionais foram referenciados para esta percepção: