Особенности постановки и решения задач с использованием искусственных нейронных сетей

Применение искусственных нейронных сетей для диагностирования изделий

Кацуба Ю. Н.1, Власова И.В.2

1Кандидат технических наук, Национальный Минерально-сырьевой университет «Горный»,  2Санкт-Петербургский университет Министерства внутренних дел Российской Федерации

Применение искусственных нейронных сетей для диагностирования изделий

Аннотация

В статье рассмотрены подходы применения метода искусственных нейронных сетей к решению задач диагностирования изделий.

Ключевые слова: изделия, диагностирование, искусственные нейронные сети.

Katsuba Y. N.1, Vlasova I. C.2

1Kandidat of technical Sciences, national Mineral resources University “Mining”,  2Saint-Petersburg University of Ministry of internal Affairs of the Russian Federation

APPLICATION OF ARTIFICIAL NEURAL NETWORKS TO DIAGNOSTIC PRODUCTS

Abstract

Обратите внимание

The article considers the approaches of application of the method of artificial neural networks to solve problems diagnostic products.

Keywords: products, diagnostics, artificial neural networks.

Анализ современных диагностических систем свидетельствует о том, что существует объективная научно-техническая проблема создания комплексных систем диагностирования, построенных на универсальных принципах, обеспечивающих высокий уровень достоверности постановки диагноза и прогнозирования технического состояния изделий.

Перспективным направлением является создание инфраструктуры диагностирования неисправностей изделий, основанной на использовании искусственных нейронных сетей.

Искусственные нейронные сети (ИНС) в задачах диагностирования и прогнозирования технического состояния изделий могут быть использованы в качестве подсистемы выборки и принятия решений, передающей диагностическую информацию другим подсистемам управления.

Задачи прогнозирования отказов изделий сложны из-за невозможности четкой постановки соответствия изменений входных и выходных параметров состояния, в котором находится или к которому стремится объект диагностирования.

Для решения задач диагностирования и прогнозирования необходимо сформировать базу с множеством состояний и произвести оценку степени влияния каждого информационного параметра на вероятность перехода изделия в какое-либо из возможных состояний.

Применение ИНС позволит проводить корректировку значений выходных сигналов объекта диагностирования, что позволит своевременно проводить при необходимости техническое обслуживание (ТО) и текущий ремонт (ТР) для обеспечения его работоспособного состояния.  Уточнение диагноза состояния изделия с использованием ИНС позволит выявить некорректные диагнозы при последовательном диагностировании и повысит его достоверность.

Задача диагностирования для ИНС формируется, как необходимость отнести входной вектор, который содержит значения тестовых векторов и выходных реакций объекта на эти вектора, к одному или нескольким возможным техническим состояниям изделия.

Важно

Задача диагностирования одновременного появления нескольких неисправностей, и решается отнесением входного вектора к нескольким техническим состояниям, которые представляют совокупность неисправностей формирующих ошибку в работе изделия.

Поэтому для диагностирования целесообразно использовать метод подбора коэффициентов влияния – межнейронных связей на основе обучения и нечетких нейронных сетей, функционирование которых основано на принципах нечеткой логики, применяющих для адаптации параметров методы обучения, как с «учителем», так и на основе самоорганизации. [2]

В диагностике технических систем нередко проявляются дефекты, при которых связь между признаками и причинами неисправностей носит неоднозначный характер.

Простые двузначные утверждения типа “исправный – 1” / “неисправный – 0” недостаточны, поскольку четкие правила поиска неисправностей в системе основываются на взаимном и однозначном соответствии между причиной и признаками неисправностей, то есть они жестко детерминированы в правилах.

Современные диагностические системы должны распознавать опасные условия функционирования, причины и тип возникшей неисправности. Помимо этого ожидается также информация об оценке оставшегося срока службы изделия или его составной части.

Таким образом, выходные параметры диагностической системы должны определять с одной стороны причину и тип дефекта (неисправности), с другой стороны – состояние объекта диагностирования, его соответствие оперативно-функциональному назначению.

Аналитические модели диагностики отказов определяют, выделяют и классифицируют отказы в компонентах системы. Основной проблемой разработки аналитических моделей диагностики отказов является определение разности.

Совет

Большинство определителей разности основаны на моделях линейных систем. Для нелинейных систем основным подходом является их линеаризация.

Однако, для систем с высокой степенью нелинейности и большим количеством нелинейных операций, такая линеаризация не дает удовлетворительных результатов.

Единственным решением данной проблемы является использование большого количества линейных систем, что не очень практично при создании моделей, работающих в реальном времени.

Процесс создания моделей очень сложен и точность получаемых результатов, проверить затруднительно.

Зная возможности нейронных сетей моделировать сложные системы обладая небольшим количеством информации, позволяет использовать их в аналитических моделях.

В задачах диагностирования и прогнозирования нечеткая нейронная сеть играет роль универсального аппроксиматора функции от нескольких переменных, реализуя нелинейную функцию

                (1)

где  – векторы входной информации (текущие измеренные значения диагностических параметров);

      Y – реализация векторной функции нескольких переменных. [3]

Постановка многих задач диагностирования и прогнозирования технического состояния объекта может быть сведена именно к аппроксимационному представлению.

Главной задачей здесь является правильное отделение нормальных разностей от разностей, содержащих данные об отказе. Для выделения отказа разность должна быть обработана таким образом, чтобы стало понятно, какой компонент системы вышел из строя.

Обратите внимание

Обработка одного сигнала разности не представляет особой трудности, однако, вектор разностей усложняет процесс определения отказа. Основным подходом определения отказа является создание набора структурированных разностных сигналов.

Для установления диагностической информации могут служить статистические модели, увязывающие критерии, оценивающие состояние объекта диагностирования, с отклонениями измеряемых параметров в виде регрессионной модели дефектов. Для оценки влияния факторных коэффициентов на возможное состояние объекта диагностирования целесообразно применение диагностических матриц, с оптимальным количеством измеряемых параметров.

В целом локализация дефектов с помощью диагностической матрицы подобна работе системы нейронов, которая получила название «перцетрон».

Уникальной особенностью для контроля технического состояния изделия является возможность диагностирования электрических машин с помощью нейронных предикторов. Нейронный предиктор (рис.

1) это математическая модель на базе искусственной нейронной сети, которая осуществляет предсказание выходного вектора состояния изделия по его предыстории на один шаг вперед.

Для использования нейронного предиктора его необходимо обучить на данных, полученных от исправной электрической машины при ее работе в различных динамических режимах. При обучении нейронная сеть аппроксимирует функциональную зависимость между входными сигналами X и выходными Y.

В качестве входных сигналов выступают напряжения на обмотках, угловая скорость и момент сопротивления, полученные в ИНС от датчиков, и дополнительно те же сигналы, задержанные на некоторое время. Выходным сигналом является предсказанный на один шаг электрический ток в обмотке.

После обучения нейронный предиктор подключается к диагностируемой электрической машине. Точность предсказания предиктора зависит от времени обучения, объема и качества обучающей выборки.

Важно

При исправном электродвигателе выходной сигнал предиктора практически совпадает с реально измеренным током, а в случае возникновения неисправности возникает рассогласование Δ.

По величине и знаку рассогласования, а также скорости изменения величины рассогласования можно производить диагностику технического состояния электрической машины. [4]

Рис. 1 – Блок-схема нейронного предиктора

Все это приводит к решению использовать нейронные сети для выделения отказов, так как нейронные сети могут быть натренированы определенным образом с целью получения соответствующей связи между входами и выходами изделия.

Каждый нейрон в простейшем случае модифицирует вычислительную сумму с помощью активационной функции в виде сигнала наличия (1) или отсутствия (0) какого-либо отказа или предотказного состояния, а в случае применения более структурированных нечетких нейронных сетей выходным сигналом может служить коэффициент влияния фактора нейронной сети более высокого уровня – вероятность нахождения объекта диагностирования в возможных рабочих, граничных, критических, нерабочих состояниях.

После предъявления входных сигналов совместно с известным входом и баз данных нейронные сети могут самонастраиваться (обучаться) под конкретный объект диагностирования для получения требуемой реакции.

  Множество контрольных точек изделия, в которых снимаются его характеристики в различных режимах работы, может считаться вектором (каждый вектор соответствует определенному динамическому режиму работы), подаваемым на вход системы.

В зависимости от условий работы изделия, вида неисправного элемента и степени повреждения получают различные характеристики одной и той же технической системы. Как правило, неисправность каждого вида связана со специфическим изменением характеристик изделия, свойственным только этой неисправности.

Совет

Нейрон, побеждающий в конкуренции при определенной комбинации характеристик изделия, представляет впоследствии либо нормальный режим работы, либо определенную неисправность, позволяя тем самым локализовать ее. На основании статистического материала создается база данных.

База данных состоит из множества характеристик, отвечающих различным нормальным и предельным состояниям в определенных режимах работы, в которых, как правило, изделие подвергается диагностированию. Главное условие корректного функционирования системы – дифференциация характеристик при различных предельных состояниях. При этом следует выделить те фрагменты характеристик, которые отличаются друг от друга.

Одной из наиболее важных преимуществ нейронных сетей является их способность представлять нелинейные преобразования, таким образом, нейронные сети способны формировать очень точную аппроксимацию для нелинейных функций любой продолжительности. Нейронные сети являются альтернативным вариантом проектирования оценочных устройств.

Читайте также:  Любопытный робот от японских производителей

Важным свойством нейронных сетей является то, что они изучают динамику системы в процессе тренировки, состоящей из нескольких тренировочных циклов, с тренировочными данными, поступающими либо из предыдущего цикла, либо состоящей из реальных сигналов.

После каждого цикла нейронная сеть узнает все больше и больше о динамике работы изделия.

Одним из наиболее важных качеств нейронных сетей является их возможность изучать динамику поведения нелинейных систем автоматически, в случае, если архитектура нейронной сети содержит как минимум три слоя. [2]

Обученная нейронная сеть, на основе мониторинга окружающих условий по исходной (входной) информации, может с высокой степенью точности предсказать появление дефектов в изделии и оценить степень его технического состояния, то есть своевременно вывести технический объект из зоны опасного режима эксплуатации для его ремонта.

Перспективными направлениями развития методов и средств диагностики являются методы, основанные на нечеткой логике или нечетких множествах, экспертные системы и нейронные сети.

Методы нечеткой логики позволяют значительно упростить описание модели объектов контроля и диагностирования, а также являются более простыми для аппаратной реализации.

Обратите внимание

Экспертные системы позволяют принимать решения о состоянии объекта контроля, если оценка состояния или поиска неисправности объекта контроля является трудно формализуемой задачей.

Искусственные нейронные сети используют для идентификации объектов контроля, распознавания образов и прогнозирования состояния технической системы. Применение ИНС позволит получить повышение быстродействия средств диагностирования за счет распараллеливания потоков обработка диагностической информации.

Литература

  1. Anil K., Jain, Jianchang Mao, K.M. Mohiuddin. Artificial Neural Networks: A Tutorial, IEEE Computer, Vol.29, No.3, March/1996, pp. 31-44.
  2. Беляков В.В., Бушуева М.Е., Сагунов В.И. Многокритериальная оптимизация в задачах оценки подвижности, конкурентоспособности автотракторной техники и диагностики сложных технических систем / В.В. Беляков, М.Е. Бушуева, В.И.  Сагунов.  Н. Новгород: НГТУ, 2001, 271 с.
  3. Викторова Е.В. Применение нечетких нейронных сетей для технической диагностики дорожных машин / Е.В. Викторова // Вестник ХНАДУ, – 2012, – вып. 56. – С. 98-102.
  4. Семыкина И.Ю. Испытательный комплекс для оценки режимов работы электроприводов горных машин / И.Ю. Семыкина, А.В. Киселев, Р.А. Кольцов // Журнал научных публикаций аспирантов и докторантов. – 2012. – № 9(75). – С 82-87.
  5. Хаханов, В.И., Щерба, О.В. Применение искусственных нейронных сетей для диагностирования цифровых сетей / В.И. Хаханов, О.В. Щерба // Радиоэлектронные и компьютерные системы. – 2010. – № 5 (46), – С. 15-20.

References

  1. Anil K., Jain, Jianchang Mao, K. M. Mohiuddin. Artificial Neural Networks: A Tutorial, IEEE Computer, Vol.29, No.3, March/1996, pp. 31-44.
  2. Belyakov centuries, Bushuyeva M. E., Sapunov Century. And. multi-objective optimization tasks assess the mobility and competitiveness of automotive engineering and diagnostics of complex technical systems / in. A. Belyakov, M. E. Bushuev, V. I. Sapunov. N. Novgorod: Nizhny Novgorod state technical University, 2001, 271 S.
  3. Viktorova E. C. Application of fuzzy neural networks for technical diagnostics of road machinery / E. C. Viktorova // Vestnik hndu, – 2012, – vol. 56. – S. 98-102.
  4. Semykina, I. Y. and Test facility for the evaluation of modes of electric mining machines / I. Y. Semykina, A. C. Kiselev, R. A. Koltsov // Journal of scientific publications of graduate students and doctoral candidates. – 2012. – № 9(75). – With 82-87.
  5. Hahanov, C. I., szczerba, O. C. Application of artificial neural networks for diagnosis of digital networks / C. I. Hahanov, O. C. szczerba // Radioelectronic and computer systems. – 2010. – № 5 (46), – C. 15-20.

Источник: https://research-journal.org/technical/primenenie-iskusstvennyx-nejronnyx-setej-dlya-diagnostirovaniya-izdelij/

Исследование методов решения задач с использованием нейронных сетей 1 Глава 1. Нейронные сети. 2 Глава 2. Задачи с использованием нейронных сетей. 3 Выводы. – презентация

1 Исследование методов решения задач с использованием нейронных сетей 1 Глава 1. Нейронные сети. 2 Глава 2. Задачи с использованием нейронных сетей. 3 Выводы Глава 3. Реализации нейронных сетей 4<\p>

2 Глава 1. Нейронные сети Искусственный нейрон. Рис.1 Схема нейрона Из рисунка видно, что искусственный нейрон, так же как и живой, состоит из синапсов, связывающих входы нейрона с ядром, ядра нейрона, которое осуществляет обработку входных сигналов и аксона, который связывает нейрон с нейронами следующего слоя. Каждый синапс имеет вес, который определяет насколько соответствующий вход нейрона влияет на его состояние.<\p>

3 Глава 1. Нейронные сети Состояние нейрона определяется по формуле: где n – число входов нейрона xi – значение i-го входа нейрона wi – вес i-го синапса Затем определяется значение аксона нейрона по формуле: Y = f(S) Где f – некоторая функция,которая называется активационной. Наиболее часто в качестве активационной функции используется так называемый сигмоид, который имеет следующий вид:<\p>

4 Глава 1. Нейронные сети Основное достоинство этой функции в том, что она дифференцируема на всей оси абсцисс и имеет очень простую производную: При уменьшении параметра a сигмоид становится более пологим, вырождаясь в горизонтальную линию на уровне 0,5 при a=0. При увеличении a сигмоид все больше приближается к функции единичного скачка.<\p>

5 Глава 1. Нейронные сети Искусственная нейронная сеть. Исскусcтвенная нейронная се́ть – это математическая модель, а также устройства параллельных вычислений, представляющие собой систему соединённых и взаимодействующих между собой простых процессоров (искусственных нейронов). Как математическая модель исскусcтвенная нейронная сеть представляет собой частный случай методов распознавания образов или дискриминантного анализа. Такие процессоры обычно довольно просты, особенно в сравнении с процессорами, используемыми в персональных компьютерах.<\p>

6 Глава 1. Нейронные сети Применение искусственных нейронных сетей. – Распознавание образов и классификация – Принятие решений и управление – Кластеризация – Прогнозирование и аппроксимация – Сжатие данных и Ассоциативная память – Производство микросхем – Применение в строительстве<\p>

7 Глава 1. Нейронные сети Распознавание образов и классификация: Принятие решений и управление: В качестве образов могут выступать различные, по своей природе, объекты: символы текста, изображения, образцы звуков и т. д. При обучении сети предлагаются различные образцы образов с указанием того, к какому классу они относятся. Образец, как правило, представляется как вектор из его признаков. При этом совокупность всех признаков должна однозначно определять класс, к которому относится образец. Эта задача близка к задаче классификации. Классификации подлежат ситуации, характеристики которых поступают на вход нейронной сети. На выходе сети при этом должен появится признак решения, которое она приняла. При этом в качестве входных сигналов используются различные критерии описания состояния управляемой системы.<\p>

Важно

8 Глава 1. Нейронные сети Кластеризация: Под кластеризацией понимается разбиение множества входных сигналов на классы, при том, что ни количество ни признаки классов заранее неизвестны. После обучения такая сеть способна определять к какому классу относится входной сигнал. Прогнозирование и аппроксимация: Способности нейронной сети к прогнозированию напрямую следуют из ее способности к обобщению и выделению скрытых зависимостей между входными и выходными данными. После обучения сеть способна предсказать будущее значение некой последовательности на основе нескольких предыдущих значение и/или каких-то существующих в настоящий момент факторов.<\p>

9 Глава 1. Нейронные сети Сжатие данных и Ассоциативная память: Способность нейросетей к выявлению взаимосвязей между различными параметрами дает возможность выразить данные большой размерности более компактно, если данные тесно взаимосвязаны друг сдругом. Обратный процесс – восстановление исходного набора данных из части информации – называется (авто)ассоциативной памятью. Ассоциативная память позволяет также восстанавливать исходный сигнал/образ из зашумленных/поврежденных входных данных. Решение задачи гетероассоциативной памяти позволяет реализовать память, адресуемую по содержимому<\p>

10 Глава 1. Нейронные сети Производство микросхем: Применение в строительстве: При проведении испытаний качества бетона используется большое количество методов. Одним из них является бурение в поисках образовавшейся полости. Однако с помощью нейросетей возможно проверить весь материал, а также определить глубину, на которой находится полость. Путем подачи звуковых волн и приема отраженного сигнала, а затем обработкой ИНС, специалисты из National Institute of Standards and Technology (NIST) способны проверить качество бетона при толщине материала до полуметра. Нейронная сеть, примененная на заводе Intel, способна идентифицировать брак на производстве. Первоначально опытной системе давали электрическую испытательную информацию от готовых чипов и соответствующих переменных управления производственным процессом. Отношения между этими двумя параметрами были определены числовым экспериментом и моделированием процесса CMOS.<\p>

11 Глава 1. Нейронные сети Классификация искусственных нейронных сетей Классификация по типу входной информации: Аналоговые нейронные сети (используют информацию в форме действительных чисел); Двоичные нейронные сети (оперируют с информацией, представленной в двоичном виде). Классификация по характеру обучения: С учителем (выходное пространство решений нейронной сети известно); Без учителя (нейронная сеть формирует выходное пространство решений только на основе входных воздействий). Такие сети называют самоорганизующимися; С критиком (система назначения штрафов и поощерений).<\p>

12 Глава 1. Нейронные сети Классификация по характеру настройки синапсов: Сети с фиксированными связями (весовые коэффициенты нейронной сети выбираются сразу, исходя из условий задачи, при этом:, где W весовые коэффициенты сети); сети с динамическими связями (для них в процессе обучения происходит настройка синаптических связей, то есть, где W весовые коэффициенты сети).<\p>

13 Глава 2. Задачи с использованием нейронных сетей. В литературе встречается большое число признаков, которые должны быть свойственны задаче, чтобы применение НС было оправдано и НС могла бы ее решить: отсутствует алгоритм или не известны принципы решения задач, но зато накоплено достаточное число примеров; проблема характеризуется большими объемами входной информации; данные неполны или избыточны, зашумлены, частично противоречивы. Отсюда можно сделать вывод, что НС хорошо подходят для распознавания образов и решения задач классификации, оптимизации и прогнозирования. Ниже расписан перечень возможных промышленных применений нейронных сетей, на базе которых либо уже созданы коммерческие продукты, либо реализованы демонстрационные прототипы.<\p>

14 Глава 2. Задачи с использованием нейронных сетей. Банки и страховые компании: автоматическое считывание чеков и финансовых документов; проверка достоверности подписей; оценка риска для займов; прогнозирование изменений экономических показателей. Административное обслуживание: автоматическое считывание документов; автоматическое распознавание штриховых кодов. Нефтяная и химическая промышленность: анализ геологической информации; идентификация неисправностей оборудования; разведка залежей минералов по данным аэрофотосъемок; анализ составов примесей; управление процессами.<\p>

15 Глава 2. Задачи с использованием нейронных сетей. Военная промышленность и аэронавтика: обработка звуковых сигналов (разделение, идентификация, локализация); обработка радарных сигналов (распознавание целей, идентификация и локализация источников); обработка инфракрасных сигналов (локализация); обобщение информации; автоматическое пилотирование. Промышленное производство: управление манипуляторами; управление качеством; управление процессами; обнаружение неисправностей; адаптивная робототехника; управление голосом.<\p>

Источник: http://www.myshared.ru/slide/329620/

Применение нейронных сетей для задач классификации

Решение задачи классификации является одним из важнейших применений нейронных сетей.

Задача классификации представляет собой задачу отнесения образца к одному из нескольких попарно не пересекающихся множеств.

Примером таких задач может быть, например, задача определения кредитоспособности клиента банка, медицинские задачи, в которых необходимо определить, например, исход заболевания, решение задач управления портфелем ценных бумаг (продать купить или “придержать” акции в зависимости от ситуации на рынке), задача определения жизнеспособных и склонных к банкротству фирм.

Цель классификации

При решении задач классификации необходимо отнести имеющиеся статические образцы (характеристики ситуации на рынке, данные медосмотра, информация о клиенте) к определенным классам. Возможно несколько способов представления данных.

Наиболее распространенным является способ, при котором образец представляется вектором. Компоненты этого вектора представляют собой различные характеристики образца, которые влияют на принятие решения о том, к какому классу можно отнести данный образец.

Например, для медицинских задач в качестве компонентов этого вектора могут быть данные из медицинской карты больного. Таким образом, на основании некоторой информации о примере, необходимо определить, к какому классу его можно отнести.

Совет

Классификатор таким образом относит объект к одному из классов в соответствии с определенным разбиением N-мерного пространства, которое называется пространством входов, и размерность этого пространства является количеством компонент вектора.

Прежде всего, нужно определить уровень сложности системы. В реальных задачах часто возникает ситуация, когда количество образцов ограничено, что осложняет определение сложности задачи. Возможно выделить три основных уровня сложности.

Первый (самый простой) – когда классы можно разделить прямыми линиями (или гиперплоскостями, если пространство входов имеет размерность больше двух) – так называемая линейная разделимость.

Во втором случае классы невозможно разделить линиями (плоскостями), но их возможно отделить с помощью более сложного деления – нелинейная разделимость. В третьем случае классы пересекаются и можно говорить только о вероятностной разделимости.

В идеальном варианте после предварительной обработки мы должны получить линейно разделимую задачу, так как после этого значительно упрощается построение классификатора.

К сожалению, при решении реальных задач мы имеем ограниченное количество образцов, на основании которых и производится построение классификатора.

При этом мы не можем провести такую предобработку данных, при которой будет достигнута линейная разделимость образцов.

Использование нейронных сетей в качестве классификатора

Сети с прямой связью являются универсальным средством аппроксимации функций, что позволяет их использовать в решении задач классификации. Как правило, нейронные сети оказываются наиболее эффективным способом классификации, потому что генерируют фактически большое число регрессионных моделей (которые используются в решении задач классификации статистическими методами).

К сожалению, в применении нейронных сетей в практических задачах возникает ряд проблем. Во-первых, заранее не известно, какой сложности (размера) может потребоваться сеть для достаточно точной реализации отображения. Эта сложность может оказаться чрезмерно высокой, что потребует сложной архитектуры сетей.

Так Минский в своей работе “Персептроны” доказал, что простейшие однослойные нейронные сети способны решать только линейно разделимые задачи. Это ограничение преодолимо при использовании многослойных нейронных сетей.

Обратите внимание

В общем виде можно сказать, что в сети с одним скрытым слоем вектор, соответствующий входному образцу, преобразуется скрытым слоем в некоторое новое пространство, которое может иметь другую размерность, а затем гиперплоскости, соответствующие нейронам выходного слоя, разделяют его на классы.

Таким образом сеть распознает не только характеристики исходных данных, но и “характеристики характеристик”, сформированные скрытым слоем.

Подготовка исходных данных

Для построения классификатора необходимо определить, какие параметры влияют на принятие решения о том, к какому классу принадлежит образец. При этом могут возникнуть две проблемы.

Во-первых, если количество параметров мало, то может возникнуть ситуация, при которой один и тот же набор исходных данных соответствует примерам, находящимся в разных классах. Тогда невозможно обучить нейронную сеть, и система не будет корректно работать (невозможно найти минимум, который соответствует такому набору исходных данных).

Исходные данные обязательно должны быть непротиворечивы. Для решения этой проблемы необходимо увеличить размерность пространства признаков (количество компонент входного вектора, соответствующего образцу).

Но при увеличении размерности пространства признаков может возникнуть ситуация, когда число примеров может стать недостаточным для обучения сети, и она вместо обобщения просто запомнит примеры из обучающей выборки и не сможет корректно функционировать. Таким образом, при определении признаков необходимо найти компромисс с их количеством.

Далее необходимо определить способ представления входных данных для нейронной сети, т.е. определить способ нормирования. Нормировка необходима, поскольку нейронные сети работают с данными, представленными числами в диапазоне 0..

1, а исходные данные могут иметь произвольный диапазон или вообще быть нечисловыми данными.

При этом возможны различные способы, начиная от простого линейного преобразования в требуемый диапазон и заканчивая многомерным анализом параметров и нелинейной нормировкой в зависимости от влияния параметров друг на друга.

Кодирование выходных значений

Задача классификации при наличии двух классов может быть решена на сети с одним нейроном в выходном слое, который может принимать одно из двух значений 0 или 1, в зависимости от того, к какому классу принадлежит образец. При наличии нескольких классов возникает проблема, связанная с представлением этих данных для выхода сети.

Наиболее простым способом представления выходных данных в таком случае является вектор, компоненты которого соответствуют различным номерам классов. При этом i-я компонента вектора соответствует i-му классу. Все остальные компоненты при этом устанавливаются в 0. Тогда, например, второму классу будет соответствовать 1 на 2 выходе сети и 0 на остальных.

При интерпретации результата обычно считается, что номер класса определяется номером выхода сети, на котором появилось максимальное значение. Например, если в сети с тремя выходами мы имеем вектор выходных значений (0.2,0.6,0.

4), то мы видим, что максимальное значение имеет вторая компонента вектора, значит класс, к которому относится этот пример, – 2. При таком способе кодирования иногда вводится также понятие уверенности сети в том, что пример относится к этому классу.

Наиболее простой способ определения уверенности заключается в определении разности между максимальным значением выхода и значением другого выхода, которое является ближайшим к максимальному.

Например, для рассмотренного выше примера уверенность сети в том, что пример относится ко второму классу, определится как разность между второй и третьей компонентой вектора и равна 0.6-0.4=0.2. Соответственно чем выше уверенность, тем больше вероятность того, что сеть дала правильный ответ. Этот метод кодирования является самым простым, но не всегда самым оптимальным способом представления данных.

Известны и другие способы. Например, выходной вектор представляет собой номер кластера, записанный в двоичной форме. Тогда при наличии 8 классов нам потребуется вектор из 3 элементов, и, скажем, 3 классу будет соответствовать вектор 011.

Важно

Но при этом в случае получения неверного значения на одном из выходов мы можем получить неверную классификацию (неверный номер кластера), поэтому имеет смысл увеличить расстояние между двумя кластерами за счет использования кодирования выхода по коду Хемминга, который повысит надежность классификации.

Другой подход состоит в разбиении задачи с k классами на k*(k-1)/2 подзадач с двумя классами (2 на 2 кодирование) каждая. Под подзадачей в данном случае понимается то, что сеть определяет наличие одной из компонент вектора. Т.е.

исходный вектор разбивается на группы по два компонента в каждой таким образом, чтобы в них вошли все возможные комбинации компонент выходного вектора.

Число этих групп можно определить как количество неупорядоченных выборок по два из исходных компонент. Из комбинаторики

$A_k^n = frac{k!}{n!,(k,-,n)!} = frac{k!}{2!,(k,-,2)!} = frac{k,(k,-,1)}{2}$

Тогда, например, для задачи с четырьмя классами мы имеем 6 выходов (подзадач) распределенных следующим образом:

N подзадачи(выхода)КомпонентыВыхода
1 1-2
2 1-3
3 1-4
4 2-3
5 2-4
6 3-4

Где 1 на выходе говорит о наличии одной из компонент. Тогда мы можем перейти к номеру класса по результату расчета сетью следующим образом: определяем, какие комбинации получили единичное (точнее близкое к единице) значение выхода (т.е. какие подзадачи у нас активировались), и считаем, что номер класса будет тот, который вошел в наибольшее количество активированных подзадач (см. таблицу).

N классаАкт. Выходы
1 1,2,3
2 1,4,5
3 2,4,6
4 3,5,6

Это кодирование во многих задачах дает лучший результат, чем классический способ кодирование.

Выбор объема сети

Правильный выбор объема сети имеет большое значение. Построить небольшую и качественную модель часто бывает просто невозможно, а большая модель будет просто запоминать примеры из обучающей выборки и не производить аппроксимацию, что, естественно, приведет к некорректной работе классификатора. Существуют два основных подхода к построению сети – конструктивный и деструктивный.

При первом из них вначале берется сеть минимального размера, и постепенно увеличивают ее до достижения требуемой точности. При этом на каждом шаге ее заново обучают. Также существует так называемый метод каскадной корреляции, при котором после окончания эпохи происходит корректировка архитектуры сети с целью минимизации ошибки.

Совет

При деструктивном подходе вначале берется сеть завышенного объема, и затем из нее удаляются узлы и связи, мало влияющие на решение. При этом полезно помнить следующее правило: число примеров в обучающем множестве должно быть больше числа настраиваемых весов.

Иначе вместо обобщения сеть просто запомнит данные и утратит способность к классификации – результат будет неопределен для примеров, которые не вошли в обучающую выборку.

Выбор архитектуры сети

При выборе архитектуры сети обычно опробуется несколько конфигураций с различным количеством элементов. При этом основным показателем является объем обучающего множества и обобщающая способность сети. Обычно используется алгоритм обучения Back Propagation (обратного распространения) с подтверждающим множеством.

Алгоритм построения классификатора на основе нейронных сетей

  1. Работа с данными
    • Составить базу данных из примеров, характерных для данной задачи
    • Разбить всю совокупность данных на два множества: обучающее и тестовое (возможно разбиение на 3 множества: обучающее, тестовое и подтверждающее).
  2. Предварительная обработка
    • Выбрать систему признаков, характерных для данной задачи, и преобразовать данные соответствующим образом для подачи на вход сети (нормировка, стандартизация и т.д.). В результате желательно получить линейно отделяемое пространство множества образцов.
    • Выбрать систему кодирования выходных значений (классическое кодирование, 2 на 2 кодирование и т.д.)
  3. Конструирование, обучение и оценка качества сети
    • Выбрать топологию сети: количество слоев, число нейронов в слоях и т.д.
    • Выбрать функцию активации нейронов (например “сигмоида”)
    • Выбрать алгоритм обучения сети
    • Оценить качество работы сети на основе подтверждающего множества или другому критерию, оптимизировать архитектуру (уменьшение весов, прореживание пространства признаков)
    • Остановится на варианте сети, который обеспечивает наилучшую способность к обобщению и оценить качество работы по тестовому множеству
  4. Использование и диагностика
    • Выяснить степень влияния различных факторов на принимаемое решение (эвристический подход).
    • Убедится, что сеть дает требуемую точность классификации (число неправильно распознанных примеров мало)
    • При необходимости вернутся на этап 2, изменив способ представления образцов или изменив базу данных.
    • Практически использовать сеть для решения задачи.

Для того, чтобы построить качественный классификатор, необходимо иметь качественные данные. Никакой из методов построения классификаторов, основанный на нейронных сетях или статистический, никогда не даст классификатор нужного качества, если имеющийся набор примеров не будет достаточно полным и представительным для той задачи, с которой придется работать системе.

Источник: https://basegroup.ru/community/articles/classification

Основы нейронных сетей. Задачи нейронных сетей

В 80-х годах ХХ века в число известных принципов программирования вошло новое направление разработок информационных систем, которое получило название искусственных нейронных систем.

Это направление было основано на открытии одного из способов обработки информации мозгом человека, согласно которому процессы решения задач моделируются путем обучения моделей нейронов, образующих сеть.

Указанный подход иногда вспоминают под названием коннекционизма (от английского слова connection — соединение).

Фундаментальное понятие нейронных сетей обусловливает структура системы обработки информации, состоящий из большого количества элементов обработки данных — нейронов, которые сообщаются связями — синапсами.

Конфигурация нейронной сети настраивается на реализацию конкретного приложения с помощью процесса усвоения знаний, т.е. обучение.

При этом, подобно биологическим системам, обучение предусматривает внесение изменений в характеристики синаптических соединений между нейронами.

Предусмотрено много способов классификации искусственных нейронных систем.

Наиболее полезный, с практической точки зрения, классификационный признак заключается в наличии или неналичии необходимости применять для такой системы учебную совокупность данных.

Если учебная совокупность предусмотрена, то искусственная нейронная система называется основанной на контролируемой модели. В противном случае модель считается неконтролируемой.

Пример нейронной сети

Хорошим примером контролируемой искусственной нейронной системы является система, используемая для распознавания образов.

В отличие от нее, в случаях, когда точно не известно какими должны быть исходные данные, искусственная нейронная система может быть применена как классификатор для группировки входных данных.

Например, распознавание больных и здоровых людей в случае обнаружения вспышек заболевания.

Классификация нейронных сетей

Нейронные сети также могут классифицироваться по следующим характеристикам:

  • способа соединения нейронов;
  • применение вычислений, выполняющих нейроны;
  • способа передачи шаблонов активности по сети;
  • способа и скорости обучения.

Нейронные сети применялись для решения практических задач всех типов. Основным преимуществом нейронных сетей является то, что они позволяют решать задачи, которые оказываются слишком сложными для обычных технологий.

Имеются в виду задачи, которые не имеют алгоритмического решения или, для которых алгоритмическое решение является очень сложным, чтобы его можно было определить аналитически.

Собственно говоря, нейронные сети хорошо подходят для решения задач, которые успешно решают люди, но не могут объяснить, как они это делают.

Задачи нейронных сетей

К числу задач нейронных систем относятся задачи распознавания образов и прогнозирования событий, в частности, нахождение тенденции изменения данных.

В нынешние времена искусственный интеллект на основе нейронных сетей широко используется при анализе скрытых закономерностей для выявления в исторических данных таких шаблонов, которыми можно руководствоваться в будущем.

Например, анализ скрытых закономерностей в данных может применяться в банковском учреждении для определения характеристик потенциального злоумышленника среди заемщиков.

Обратите внимание

Кроме того, нейронные сети используются, как интерфейсная часть в экспертных системах, обрабатывающих большие объемы входных данных от датчиков, и от которых требуется реакция в реальном времени.

В частности, в 1980-х годах нейронная сеть, которая эксплуатировалась на обычном микрокомпьютере, позволила получить очень качественное решение задачи коммивояжера за 0,1 секунды.

Этот результат намного превышал время получения оптимального решения с применением традиционной алгоритмической системы на аналогичном оборудовании, который составлял, в то, время один час.

Следует отметить, что задача коммивояжера имеет важное практическое значение, поскольку является классической задачей, которую приходится решать при маршрутизации пакетов в системе передачи данных.

Задача поиска оптимальных маршрутов является важным средством минимизации времени, поскольку от этого зависят эффективность и быстродействие, как при маршрутизации пакетов данных через Интернет, так и при доставке посылок почтой многочисленным адресатам.

(Пока оценок нет)
Загрузка…

Источник: https://LibTime.ru/expertsystems/osnovy-neyronnyh-setey-zadachi-neyronnyh-setey.html

Ссылка на основную публикацию