Отправьте статью сегодня! Журнал выйдет ..., печатный экземпляр отправим ...
Опубликовать статью

Молодой учёный

Использование нейронных сетей в задачах распознавания образов

Информационные технологии
17.05.2025
10
Поделиться
Библиографическое описание
Клюшникова, А. В. Использование нейронных сетей в задачах распознавания образов / А. В. Клюшникова. — Текст : непосредственный // Молодой ученый. — 2025. — № 20 (571). — С. 28-30. — URL: https://moluch.ru/archive/571/125447/.


В статье рассматривается решение задачи распознавания образов на примере методов глубокого обучения: сверточные нейронные сети (CNN). Рассмотрены основные задачи, решаемые с помощью CNN, достоинства и недостатки CNN.

Ключевые слова: нейронные сети, распознавание образов, глубокое обучение, сверточные нейронные сети (CNN).

Распознавание образов.

Распознавание образов — это научное направление, связанное с разработкой принципов и построением систем, предназначенных для определения принадлежности объекта к одному из классов. Классы объектов могут быть заранее выделены (задача классификации ) или количество классов выявляется в процессе решения задачи (задача кластеризации ). Под объектами в распознавании образов понимают: различные предметы и явления, процессы и ситуации, сигналы и т. п. [2]. Помимо смыслового (семантического) отличия, вкладываемого в понятие образ, они отличаются друг от друга также по способу представления (синтаксису):

— в классических моделях образ обычно описывается набором признаков, каждый из которых характеризует определенное свойство объекта;

— в структурных моделях в качестве образа выступает некоторое высказывание, порождаемое грамматикой, характеризующей класс;

— в задачах обработки текста роль образа выполняет некоторая цепочка символов или шаблонное представление этой цепочки (например, регулярные выражения).

Одной из важных областей применения теории распознавания образов является решение задач прогнозирования поведения объектов или развития ситуации [1]. К задачам этого вида относятся задачи технической и медицинской диагностики, геологического прогнозирования, прогнозирования свойств химических соединений, сплавов и новых материалов, прогнозирования урожая и хода строительства крупных объектов, обнаружения лесных пожаров, управления производственными процессами и т. д.

Как работает распознавание образов.

Распознавание образов может выполняться с использованием либо традиционных методов обработки изображений, либо современных сетей глубокого обучения.

1. Методы обработки изображений , как правило, не требуют исторических данных для обучения и по своей природе неконтролируемы. Одним из наиболее популярных инструментов для решения задачи обработки изображений является библиотека OpenCV. Данная библиотека содержит алгоритмы компьютерного зрения, обработки изображений и алгоритмы численных методов общего назначения.

Преимущества данной группы методов заключаются в том, что для решения задачи не требуется аннотированных изображений, где люди маркируют данные вручную (для контролируемого обучения).

Недостатки методов: данные методы ограничены несколькими факторами, такими как сложные сценарии (без одноцветного фона), окклюзия (частично скрытые объекты), освещение и тени, и эффект беспорядка [5].

2. Методы глубокого обучения обычно зависят от контролируемого или неконтролируемого обучения, при этом контролируемые методы являются стандартом в задачах компьютерного зрения. Производительность ограничена вычислительной мощностью графических процессоров, которая стремительно растет с каждым годом.

Достоинства методов: обнаружение объектов с помощью глубокого обучения значительно более устойчиво к окклюзии, сложным сценам и сложному освещению.

Недостатки: требуется огромное количество обучающих данных; процесс аннотации изображений является трудоемким и дорогостоящим. Например, маркировка 500 000 изображений для обучения пользовательского алгоритма обнаружения объектов глубокого обучения считается небольшим набором данных. Однако многие эталонные наборы данных (MS COCO, Caltech, KITTI, PASCAL VOC, V5) обеспечивают доступность помеченных данных [3].

В качестве примера метода глубокого обучения рассмотрим сверточные нейронные сети (CNN).

Сверточные нейронные сети CNN.

Сверточные нейронные сети — класс нейронных сетей, разработанный специально для анализа данных с пространственной структурой, таких как изображения и видео. CNN используется для решения следующих задач: идентификация объекта, распознавание лиц, семантическое определение границ и пр.

На рисунке 1 приведен пример исходного изображения и примеры задач, решаемых с помощью CNN [4]:

— определение границ — это самая низкоуровневая задача, для которой уже классически применяются сверточные нейронные сети;

— определение вектора к нормали позволяет нам реконструировать трёхмерное изображение из двухмерного;

— Saliency, определение объектов внимания — это то, на что обратил бы внимание человек при рассмотрении данного изображения;

— семантическая сегментация позволяет разделить объекты на классы по их структуре, ничего не зная об этих объектах, то есть еще до их распознавания;

— семантическое выделение границ — это выделение границ, разбитых на классы;

— выделение частей тела человека;

— распознавание самих объектов.

Этапы обработки исходного изображения

Рис. 1. Этапы обработки исходного изображения

CNN обладают способностью достигать высокой точности в решении задач компьютерного зрения, включая классификацию изображений, сегментацию и детекцию объектов. Они способны к автоматическому извлечению признаков из входных данных. Это упрощает процесс обработки изображений и помогает избежать необходимости вручную создавать признаки.

Архитектуры CNN могут быть адаптированы к различным задачам, начиная от распознавания лиц до анализа медицинских изображений. Существуют предобученные CNN модели, которые можно использовать в качестве базовой архитектуры и дообучать на конкретных данных.

Основными недостатками CNN являются: требовательность к вычислительным ресурсам, необходимость большого объема данных, сложность для интерпретации и объяснения, некоторые модели могут иметь тенденцию к «запоминанию» данных обучения и некорректно работать с новыми изображениями.

Заключение

В данной статье было рассмотрено решение задачи распознавания образов на примере двух основных методов: «классическая» обработка изображений и глубокое обучения. Был рассмотрен метод сверточных нейронных сетей (CNN), как один из самых распространенных методов глубокого обучения: рассмотрены основные задачи, которые могут решаться с помощью CNN, достоинства и недостатки данного метода.

Литература:

  1. Хабаров С. П. Интеллектуальные информационные системы. PROLOG- язык разработки интеллектуальных и экспертных систем: учебное пособие / С. П. Хабаров.- СПб. СПбГЛТУ, 2013.- 138 с.
  2. Распознавание образов с помощью искусственного интеллекта [Электронный ресурс] // Хабр. URL: https://habr.com/ru/articles/709432/.
  3. Yann LeCun, J. S. Denker, S. Solla, R. E. Howard and L. D. Jackel: Optimal Brain Damage, in Touretzky, David (Eds), Advances in Neural Information Processing Systems 2 (NIPS*89), Morgan Kaufman, Denver, CO, 1990
  4. Методы распознавания образов: от простых до сложных [Электронный ресурс] // SimbirSoft. URL: https://www.simbirsoft.com/blog/metody-raspoznavaniya-obrazov-ot-prostykh-do-slozhnykh/?ysclid=maosiwsjx492150985.
  5. Наталия Ефремова, лекция с конференции Highload++, 2017.
Можно быстро и просто опубликовать свою научную статью в журнале «Молодой Ученый». Сразу предоставляем препринт и справку о публикации.
Опубликовать статью
Ключевые слова
нейронные сети
распознавание образов
глубокое обучение
сверточные нейронные сети (CNN)
Молодой учёный №20 (571) май 2025 г.
Скачать часть журнала с этой статьей(стр. 28-30):
Часть 1 (стр. 1-67)
Расположение в файле:
стр. 1стр. 28-30стр. 67

Молодой учёный