Специалисты Массачусетского технологического института (МТИ) научили искусственный интеллект разрабатывать алгоритмы, наделённые свойством любопытства. Инженеры утверждают, что такие алгоритмы работают эффективнее и адаптируются к новым средам лучше, чем алгоритмы, разработанные людьми.
Люди приобретают новые навыки, исследуя мир и учась на собственном опыте. Компьютеры, напротив, часто «застревают», когда попадают в новую для себя среду, отмечают в МТИ. Чтобы избежать этого, инженеры пытаются программировать нейросети на исследования незнакомой среды, придавая им свойство любопытства в надежде, что такая модель будет действовать в незнакомой среде более эффективно. Под любопытством в данном случае подразумевается функция алгоритма, которая в качестве вознаграждения использует ошибку прогноза. Искусственный интеллект пытается предсказать будущее состояние — например, следующий кадр при просмотре видео — и лучшим результатом считается тот, который не совпадает с прогнозом. Таким образом, ИИ лучше адаптируется к новому.
В последние годы процесс проектирования нейросетей автоматизируют с помощью таких программ, как Google AutoML и auto-sklearn в Python. Исследователи из МТИ попытались создать ИИ, который будет разрабатывать нейросети, запрограммированные на любопытство.
«Алгоритмы, разработанные людьми, носят очень общий характер, — указывает один из авторов исследования Ферран Алет, аспирант в МТИ. — Мы использовали ИИ, чтобы найти алгоритмы, которые смогут адаптироваться к различным средам».
Исследователи создали алгоритм «метаобучения», который, в свою очередь, сгенерировал 52 тысячи алгоритмов, закодированных на исследования. В течение 10 часов компьютеры выбирали из этих 52 тысяч лучшие, отсеяв в процессе более 99%. В итоге около ста алгоритмов машина признала высокопроизводительными. В то же время, указывают в МТИ, лучшие 16 из этих ста своими свойствами превосходили разработанные человеком. Во все 16 алгоритмов было запрограммировано свойство любопытства.
Ранее Google сообщила о разработке нового инструмента создания алгоритмов под названием Auto-ML Zero. Программа генерирует большое количество алгоритмов, используя комбинации из ста различных простых математических операций. После этого Auto-ML Zero проверяет отобранные алгоритмы на способность выполнять заданные функции. После того, как ИИ выполнит задания, Auto-ML Zero сравнивает производительность алгоритмов и выбирает лучшие. Из разных частей выбранных алгоритмов AutoML-Zero создаёт единый ИИ.
Идея наделить искусственный интеллект любопытством пришла учёным из OpenAI и и Университета Беркли. Они пришли к выводу, что это свойство позволит роботам более эффективно принимать самостоятельные решения. Они протестировали созданный ими алгоритм на 54 видеоиграх, и в Super Mario Bros искусственный интеллект прошёл 10 уровней без внешнего вознаграждения, исходя только из собственного любопытства.