Квантумран

ИЗОБРАЖЕНИЕ КРЕДИТ:

Istock

Сверточная нейронная сеть (CNN): обучаем компьютеры видеть

Сверточные нейронные сети (CNN) обучают ИИ лучше идентифицировать и классифицировать изображения и аудио.

Автор:
Имя автора
Квантумран Форсайт
1 декабря 2023

Сводка статистики

Сверточные нейронные сети (CNN) играют ключевую роль в классификации изображений и компьютерном зрении, меняя то, как машины идентифицируют и понимают визуальные данные. Они имитируют человеческое зрение, обрабатывая изображения с помощью сверточных, объединяющих и полностью связанных слоев для извлечения признаков и анализа. CNN имеют разнообразные применения, в том числе в розничной торговле для рекомендаций по продуктам, в автомобилестроении для повышения безопасности, в здравоохранении для обнаружения опухолей и в технологиях распознавания лиц. Их использование распространяется на анализ документов, генетику и анализ спутниковых изображений. По мере растущей интеграции в различные сектора CNN вызывают этические проблемы, особенно в отношении технологии распознавания лиц и конфиденциальности данных, что подчеркивает необходимость тщательного рассмотрения их развертывания.

Контекст сверточной нейронной сети (CNN)

CNN — это модель глубокого обучения, основанная на том, как люди и животные используют глаза для идентификации объектов. Компьютеры не имеют такой возможности; когда они «просматривают» изображение, оно переводится в цифры. Таким образом, CNN отличаются от других нейронных сетей своими расширенными возможностями анализа данных изображений и аудиосигналов. Они предназначены для автоматического и адаптивного изучения пространственных иерархий объектов, от шаблонов низкого до высокого уровня. CNN могут помочь компьютеру приобрести «человеческие» глаза и обеспечить ему компьютерное зрение, позволяя ему поглощать все пиксели и числа, которые он видит, и помогать в распознавании и классификации изображений.

ConvNets реализует функции активации в карте объектов, чтобы помочь машине определить, что она видит. Этот процесс обеспечивается тремя основными уровнями: сверточным, пуловым и полносвязным. Первые два (сверточный и групповой) выполняют извлечение данных, а полностью связный уровень генерирует выходные данные, например, классификацию. Карта объектов переносится из слоя в слой до тех пор, пока компьютер не увидит всю картину. CNN получают как можно больше информации для обнаружения различных характеристик. Поручая компьютерам искать края и линии, эти машины учатся быстро и точно идентифицировать изображения со скоростью, невозможной для человека.

Разрушительное воздействие

Хотя CNN чаще всего используются для задач распознавания и классификации изображений, их также можно использовать для обнаружения и сегментации. Например, в розничной торговле CNN могут визуально искать, чтобы идентифицировать и рекомендовать предметы, которые дополняют существующий гардероб. В автомобилестроении эти сети могут отслеживать изменения дорожных условий, например, определять линию полосы движения, чтобы повысить безопасность. В здравоохранении CNN используются для более точной идентификации раковых опухолей путем отделения поврежденных клеток от окружающих их здоровых органов. Между тем, CNN усовершенствовали технологию распознавания лиц, позволяющую платформам социальных сетей идентифицировать людей на фотографиях и давать рекомендации по маркировке. (Однако Facebook решил прекратить эту функцию в 2021 году, сославшись на растущие этические проблемы и нечеткую нормативную политику в отношении использования этой технологии).

Анализ документов также можно улучшить с помощью CNN. Они могут проверить рукописную работу, сравнить ее с базой данных рукописного контента, интерпретировать слова и многое другое. Они могут сканировать рукописные документы, важные для банковского дела и финансов, или классифицировать документы для музеев. В генетике эти сети могут оценивать клеточные культуры для исследования заболеваний путем изучения изображений, картирования и прогнозной аналитики, чтобы помочь медицинским экспертам в разработке потенциальных методов лечения. Наконец, сверточные слои могут помочь классифицировать спутниковые изображения и быстро идентифицировать их, что может помочь в исследовании космоса.

Применение сверточной нейронной сети (CNN)

Некоторые приложения сверточной нейронной сети (CNN) могут включать:

Более широкое использование в медицинской диагностике, включая радиологию, рентген и генетические заболевания.
Использование CNN для классификации потоковых изображений с космических кораблей и станций, а также луноходов. Военные ведомства могут применять CNN к спутникам наблюдения и дронам для автономной идентификации и оценки безопасности или военных угроз.
Улучшенная технология оптического распознавания рукописных текстов и изображений.
Усовершенствованные приложения для роботизированной сортировки на складах и предприятиях по переработке отходов.
Их использование при классификации преступников и лиц, представляющих интерес, по городским или внутренним камерам наблюдения. Однако этот метод может быть подвержен предвзятости.
Все больше компаний задаются вопросами об использовании ими технологии распознавания лиц, в том числе о том, как они собирают и используют данные.

Вопросы для комментариев

Как еще, по вашему мнению, CNN могут улучшить компьютерное зрение и как мы используем его ежедневно?
Каковы еще возможные преимущества лучшего распознавания и классификации изображений?

Добавить в список