
Продолжаем «неделю нейронных сетей». В этом посте вы узнаете о нейронных сетях на примерах математических моделей. Говоря проще, вы узнаете о том, как представить нейронные сети с помощью математических уравнений. Дата-сайентисту или исследователю машинного обучения было бы неплохо получить представление о том, как нейронные сети могут быть преобразованы в кучу математических уравнений, для вычисления различных значений. Хорошее понимание представления выходных данных функции активации различных вычислительных блоков (узлов, нейронов) в разных слоях может помочь быстрее и лучше понять алгоритм обратного распространения.
Под катом — простое и краткое введение в математическое представление нейронных сетей для интересующихся теорией практиков: от перцептрона до сети с двумя скрытыми слоями.
Однослойная нейронная сеть (перцептрон)
Вот как выглядит однослойная нейронная сеть. А вот тут можно почитать, как эта сеть объяснена с помощью примера на Python.

Перцептрон — однослойная нейронная сеть
Вот как могло бы выглядеть математическое уравнение для получения значения
a1
(выходной узел) в качестве функции входных x1, x2, x3
.В приведенном выше уравнении верхний индекс веса представляет слой, а нижний индекс весов представляет вес соединения между входным и выходным узлами. Таким образом, представляет вес первого уровня между узлом 1 в следующем слое и узлом 2 в текущем слое.
Нейронная сеть с одним скрытым слоем
Ниже нейронная сеть с одним скрытым слоем, имеющим три нейрона, входным слоем с тремя входными нейронами и выходным слоем с одним нейроном.

Нейронная сеть с входным, скрытым и выходным слоями
Вот так может выглядеть математическое уравнение для получения значения
a1, a2 и a3
в слое 2 в качестве функции входных x1, x2, x3
. Кроме того, значение a1
в слое 3 представлено как функция значений a1, a2 и a3
в слое 2.Сначала давайте представим выходные значения, обработанные в трех скрытых нейронах скрытого слоя. Входной слой представлен как слой 1, скрытый слой как слой 2 и выходной слой — это слой 3.
Определим выходное значение узла в выходном слое. Значение представляется как функция от
a1, a2
и a3
в предыдущих узлах, которые могут быть представлены как значения x1, x2
и x3
во входном слое.Нейронная сеть с одним скрытым слоем (3 нейрона) и выходным слоем (2 нейрона)
Ниже представлена нейронная сеть с одним скрытым слоем, имеющим три нейрона, входным слоем с двумя входными нейронами, а также выходным слоем с двумя нейронами.

Трехслойная нейронная сеть
Вот так может выглядеть математическое уравнение для получения значения
a1, a2, a3
в слое 2 в качестве функции входных значений x1, x2
. Кроме того, значение a1, a2
в слое 3 представлено как функция значений a1, a2, a3
в слое 2.Сначала давайте представим выходные значения, обработанные в трех скрытых нейронах скрытого слоя. Входной слой представлен как слой 1, скрытый слой как слой 2 и выходной слой — это слой 3.
Определим выходное значение узлов в выходном слое. Значение представляется как функция от
a1, a2, a3
в предыдущих узлах, которые могут быть представлены как значения x1, x2, x3
во входном слое.Сети глубокого обучения с двумя скрытыми слоями
Наконец, давайте посмотрим, как выходные значения узлов
a1
в выходном слое могут быть выражены в виде математических вычислений как функция входных сигналов x1, x2
. Вот схема сети глубокого обучения, имеющей два скрытых слоя, один из которых имеет три узла, а другой — два узла. Затем имеется входной уровень с двумя входными узлами, и выходной слой с одним выходным узлом. Вот схема упрощенной сети глубокого обучения.
Нейронная сеть глубокого обучения
Значения в слое 2 (
a1, a2, a3
) и слое 3 (a1, a2
) останутся такими же, как в предыдущем разделе. Давайте представим значение 1 в выходном слое как функцию значений a1 и a2 в предыдущем слое (слой 3).Заключение
Ниже краткое изложение того, что вы узнали в этом посте о представления нейронных сетей в виде математических моделей:
- Важно понимать обозначения, в которых вы будете представлять нейронную сеть как уравнение.
- Первому или входному слою можно назначить номер 1, скрытому номер 2, а выходному 3.
- Весам между входным узлом в одном слое и узлом в следующем слое назначается верхний индекс — значение слоя, состоящего из входного узла. Нижний индекс веса состоит из двух чисел — числа, представляющего узел в следующем слое и номера входного узла.
В посте показана лишь «верхушка айсберга», который из себя представляют нейронные сети. Если пост заинтриговал вас — приходите к нам, расскажем больше. А промокод HABR даст вам получить дополнительные 10% к скидке указанной на баннере.

- Онлайн-буткемп по Data Science
- Обучение профессии Data Analyst с нуля
- Онлайн-буткемп по Data Analytics
- Обучение профессии Data Science с нуля
- Курс «Python для веб-разработки»
Eще курсы
- Курс по аналитике данных
- Курс по DevOps
- Профессия Веб-разработчик
- Профессия iOS-разработчик с нуля
- Профессия Android-разработчик с нуля
- Профессия Java-разработчик с нуля
- Курс по JavaScript
- Курс по Machine Learning
- Курс «Математика и Machine Learning для Data Science»
- Продвинутый курс «Machine Learning Pro + Deep Learning»
neurocore
Что, простите) Умножение матриц? Это даже на заметку не тянет.