В 2023 году технологии нейросетей буквально разделили мир на «до» и «после» выпуска десятков сервисов на основе ИИ. Диджитал‑сообщество потрясли новые возможности в области генерации и анализа контента, вариаций применения технологий и даже перспектив некоторых профессий в связи с их автоматизацией посредством ИИ.
Однако хотя мощный тренд на нейросети и стартовал совсем недавно, мало кто задумывается о том, что идея ИИ зародилась задолго до появления ChatCPT и Midjourney. Сегодняшней публикацией мы открываем цикл статей о долгой истории нейросетей, витки которой шли в ногу с возможностями вычислительных мощностей.
Нейросеть — это математическая модель, созданная на основе принципов естественных нейронных связей. Отвечая на вопрос о том, как человечество создавало эту совершенную технологию, начнем с самого начала.
Зарождение идеи
Идея об искусственном интеллекте — продукт далеко не текущего века, и даже не века ХХ. Ведь основой ИИ можно считать современную науку о логике, основателями которой были еще древние греки — Сократ, Платон, Аристотель, а продолжателями — философы Нового времени, в частности — Рене Декарт с его «картезианским сомнением» как универсальным методом познания.
Выводы философов стали первой ступенью к созданию вычислительных устройств — в 1500 году Леонардо да Винчи спроектировал первый механический калькулятор, а в 1623 году немецкий ученый Вильгельм Шиккард разработал первую знаменитую вычислительную машину — арифмометр. Продолжил тенденцию французский ученый Блёз Паскаль — в 1642 году он построил суммирующую арифметическую машину Паскалину.
В 1673 году его коллега из Германии Готфрид Вильгельм Лейбниц создал первую машину, которая выполняла операции над понятиями, а не над числами. По мере дополнения устройства набором действий, его признали арифметико‑логическим. Вторым вкладом Лейбница в развитие компьютерных технологий стала многолетняя работа над изучением двоичной системой счисления.
Предпосылки к разработке ИИ в 30-40 гг
Если до ХХ века ученые пытались сформулировать эффективные способы мышления человека и создать примитивные вычислительные аппараты, то современная наука заинтересовалась разработкой мышления машины.
Теория логического позитивизма
Первой масштабной теорией мышления как вычислительного процесса стала доктрина логического позитивизма, разработанная Венским кружком ученых (1920–1930 гг.) под руководством Рудольфа Карнапа и Карла Хемпеля. Она гласит, что все знания могут быть обозначены посредством логических теорий, связанных с констатирующими предложениями, основанными на входных сенсорных данных — опыте.
За данной теорией последовал ряд фундаментальных математических разработок и разработок в области нейропсихологии.
Теория вероятностей
В 1933 году советский математик А. Н. Колмогоров сформулировал общепринятую формальную систему для математического описания теории вероятностей, ставшую одной из основ работы современных нейросетей.
Математическая модель нейрона
В 1943 году американские нейрофизиолог Уоррен Мак‑Калок и нейролингвист Уолтер Питтс по принципу упрощенной версии естественного нейрона создали узел искусственной нейронной сети. Фактически он представлял собой нелинейную функцию от линейной комбинации входных сигналов, которая посылает результат на единственный выход.
Объединив выходы одних искусственных нейронов со входами в другие, ученые получили первый прототип современных нейросетей.
Теория игр
Огромным вкладом в развитие идеи стали труды Джона фон Неймана — в 1944 году он создал основу для архитектуры большинства современных компьютеров и совместно с Оскаром Моргенштерном основал теорию игр — принципиальную основу алгоритмов ИИ, которую авторы изложили в книге «Теория игр и экономическое поведение».
Первая версия ИИ в 50-60 гг.
Изобретение Перцептрона
В 1958 году американский нейрофизиолог Фрэнк Розенблатт разработал математическую модель восприятия информации мозгом Перцептрон, ставший одной из первых моделей нейросетей. В 1960 году эта кибернетическая модель мозга была реализована в виде первого в мире нейрокомпьютера «Марк-1».
По своей сути Перцептрон представлял собой модель машинного обучения — нейросеть с алгоритмом реализации двоичной классификации, которая определяет отношение объекта к категории. Обучение нейросети происходило по аналогии с системой обучения человека:
1) в Перцептрон вводили определенные данные об объектах и их категориях;
2) предоставляли машине изображения объектов и предлагали определить их категорию;
3) если категории определены верно, данные оставляли в прежнем формате;
4) если в выборе категорий появлялась ошибка, данные Перцептрона подлежали корректировке и процесс повторялся до тех пор, пока машина не выдавала правильный результат.
Разочарование в технологиях во 70-е гг.
К моменту изобретения Перцептрона в научном сообществе главенствовало мнение, что для реализации функций мозга человека в технологиях достаточно лишь построить огромную нейросеть. Но так называемые однослойные сети оказались неспособными решить простейшие задачи, в том числе — воплотить функцию «исключающее „или“».
Апогеем разочарования в возможностях Перцептрона стала публикация американского ученого в области искусственного интеллекта Марвина Ли Минского, выпущенная в 1969 году. В ней было представлено формальное доказательство ограниченности Перцептрона как неспособности его решать широкий пул задач. Работа определила спад интереса к нейросетям на ближайшее десятилетие.
Выводы
В этой публикации мы рассмотрели:
предысторию нейросетей,
ученых, работавших над предпосылками для сегодняшних технологий,
прорывы в области нейросетей в начале ХХ века
этап пессимизма научного сообщества, который произошел в конце 1960-х гг.
О следующем этапе истории нейросетей — эпохе оптимизма, читайте в нашей следующей публикации. В ней мы расскажем:
об открытиях, на основе которых построили первые мощные многослойные сети,
о методе обратного распространения ошибки, позволившем обучать нейросети.