Развитие искусственного интеллекта, как и его восприятие человеком, прошло сложный путь и продолжается на наших глазах. ИИ давно вырос из коротких штанишек простого помощника человека и все активнее заявляет о своих правах. Стартующий в 2019 году технологический конкурс Up Great ставит перед собой долгосрочную амбициозную цель — создать универсальный ИИ, который будет обучаться вместе с людьми в ходе совместной деятельности. А это значит, что пришло время окончательно решить, кем является ИИ для человека и кем человек является для ИИ.

Шахматы
Одиннадцатое мая 1997 года. Нью-Йорк. Мир шахмат изменился навсегда. Машина победила человека. Стало понятно: игра уже не будет прежней — машина сильнее. Спустя годы Гарри Каспаров поедет по миру и в лекциях будет вспоминать о том, какими были шахматы и какими стали сегодня.
«Играя с машиной, ты словно играешь с пятиклассником — только в конце ты проигрываешь», — вспоминает он. Типичная игра компьютера отличается от человеческой: это прежде всего тактика и стратегия, основанная на последовательном получении маленького и едва заметного преимущества в каждом шаге. Горизонт планирования и расчета по дереву решений у человека и машины существенно отличается. Магнус Карлсен утверждает, что видит в среднем на 15, а иногда на 20 ходов вперед (не endspiel) — современные компьютеры могут обсчитать на порядок большее число шагов. Заметим, что для создания подобной системы необходимо иметь два ключевых элемента: функцию оценки доски и алгоритм обхода дерева возможных решений.
Первый модуль говорит нам, насколько хороша данная расстановка фигур для нас, а второй, модуль поиска, используя эту функцию, смотрит на возможные N шагов вперед и пытается найти наиболее выгодный шаг. Частой эвристикой и эффективным алгоритмом поиска является альфа-бета отсечение, а также стохастический метод Монте-Карло поиска по дереву. В чем соль? Мы играем в игру min-max: мы хотим сделать такой шаг, чтобы полученная доска была оптимальна для нас, а ответный шаг был минимален. Для этого мы просчитываем все возможные ответы оппонента, рассчитывая, как на них можно максимально эффективно ответить. Для этого нам нужно перейти на глубину n+1 и заново рассчитать min-max. Повторяя эту операцию N раз, мы можем узнать оптимальное для нас состояние доски через 2*N шагов (или N наших шагов).
Evaluation function — как правило, набор экспертных эвристик, оценивающих качество доски для нашего игрока
Каспаров говорит, что сейчас все профессионалы тренируются с машинами: «Когда-то это было невозможно себе представить — правила игры поменялись». К сожалению, многие слепо следуют в тренировках советам машин. Как наставник Магнуса он отмечает, что прежде всего того отличает от других игроков в шахматы способность «прочувствовать» логику машины во время тренировки.
Когда-то мы учили машины «видеть» доску и «находить» лучший ответ на действия оппонента, а сейчас на основе этих алгоритмов, которые вдохновлялись видением и тактикой шахматистов и были основаны на человеческом опыте игры в шахматы, мы обучаем будущих и настоящих игроков в шахматы. Круг замкнулся?
На самом деле все куда интереснее, ведь связки «человек + машина», как правило, сильнее, чем человек или машина в отдельности. И здесь мы видим совершенно новое направление augmented intelligence. Подобные шахматы получили название advanced chess. Вышла невероятно интересная игра: взаимодействие машинной и человеческой логики.
Всегда ли машины работают на строгом расчете? Или у них есть «интуиция»?
αГо и триумф машинного обучения
Девятое марта 2016-го. Сеул. Практически никто из профессиональных игроков не верит, что легендарный Ли Седоль может проиграть машине в го — ведь это «священный Грааль» игр и самая сложная из настольных игр с открытой информацией.
На каждый шаг в шахматах есть 20 осмысленных переходов-ответов. В го их около 200. Это означает, что всего через несколько шагов число возможных комбинаций превышает число молекул в обозримой вселенной. Ниже приведен план «раскрытия» дерева возможных решений во времени (по шагам — слева направо).
Общая стратегия, как мы видим на схеме ниже, похожа на алгоритм поиска.
  1. Выбор (Selection). Симулирует обход дерева, выбирая дуги с максимальным весом Q (насколько хорош шаг).
  2. Раскрытие вершины (Expansion). Если вершина выбрана при обходе, она скармливается supervised learning (SL) policy network для получения априорных вероятностей возможных шагов.
  3. Оценка (Evaluation). Включается Reinforcement Learning стратегия, которая играет множество игр и оценивает, насколько текущая позиция хороша (условно, если белые выиграли у черных 8 из 10 раз начиная с данной расстановки, то вес позиции — 0,8).
  4. Backup. Приписываем вес всему дереву и продолжаем поиски.
Нейросети играют роль «интуиции» машины. Если в случае с шахматами в деле строгая логика, то здесь просчитать ходы невозможно.
В документальном фильме про AlphaGo мы видим, как система играет на 5-й линии. Шаг 37. Комментатор говорит, что это ошибка человека за столом. Приходит ответ системы: «Нет, это не ошибка». Корея замирает. Эксперты меняются в лице. Ли уходит покурить. Мир Го перевернулся навсегда.
Шаг 37 AlphaGo — игра на пятой линии
Это был всего лишь расчет, точный и кропотливый. Если Каспаров говорил, что машина — это школьник-пятиклассник, то в этот момент пятиклассником оказался сам мир.
В одной-единственной игре, возможно, последней, когда человек победил машину в Го, Ли Седоль делает свой 78-й ход. Машина говорит, что такой ход фактически невозможен — так никто никогда бы не пошел. Этот ход назовут «прикосновением Бога».
Шаг 78: Ли Седоль — «прикосновение бога»
Ход 37 был всего лишь расчетом, а ход 78 — откровением, актом человеческой интуиции, творчества и даже искусством, но без хода 37 не было бы и хода 78. Не делает ли это его чем-то большим, чем просто расчет? Не узнали ли мы о себе что-то, чего никогда не узнали бы без машин?
Может быть, это станет переходом из фазы «человек против машины» в фазу «человек и машина»?
Игры: что дальше?
Почему игры вызывают такой интерес? Сейчас понятно, что для того, чтобы решать реальные жизненные задачи, нужно абстрактное мышление и математика, что почти не требует общих знаний о физическом мире. Возможностей компьютеров пока (пусть и есть какие-то примеры) не хватает для моделирования всего мира. А игры — это интересная абстракция части существующего мира, и в них можно играть эффективно. Именно поэтому такая ситуация стала одним из бенчмарков развития искусственного интеллекта.
Сейчас мы видим, как DeepMind, OpenAi и многие другие покоряют новые горизонты.
На подходе системы, которые могут ориентироваться в пространстве и взаимодействовать с друг другом (например, Dota и StarCraft), используя совершенно разные стратегии, тактики и доступные ресурсы — безусловно, все это необходимо для применения подобных систем в реальной жизни.
Интересный инсайт: в такой игре, как StarCraft, обладая возможностью быстро и безошибочно контролировать и координировать действия, простые линейные юниты побеждают даже самые сложные комбинации созданий и существ. Это поможет упростить дизайн сложных инженерных систем, которые мы создаем сейчас.
Ну а DeepMind просто натренировал идеально скоординированную армию роботов-убийц — нет никаких поводов для волнений.
Реальная жизнь и взаимное обучение с ИИ: умные помощники
Стоит нам произнести: «Alexa Spotify Random Access Memories by Daft Punk», как заиграет хорошая музыка.
А тем временем сложилась целая цепочка решений, принятых несколькими разными системами искусственного интеллекта. Первый слой — голосовой модуль — преобразовал записанный звук в отдельные слова. Затем внутренняя система обнаружила команду активации.
Выделим ключевые аспекты процесса:
  • Команда активации — Alexa;
  • Команда выбора модуля — музыкальный модуль Spotify;
  • Spotify query template matching <album> by <artist> — тут подсистема поняла, что у нас запрос вида <music> by <performer> и что в данной ситуации <music> является альбомом, а <performer> — группой.
И тут случается что-то невероятное. Сначала мы учим помощника понимать человеческую речь, общаясь с ним так, как с обычным человеком, но потом незаметно для себя мы переходим на искусственный язык запросов.
Кому-то пример с голосовым помощником может показаться надуманным (pun intended), ведь совсем не обязательно пользоваться системой в духе Алексы или Алисы. Но автоматические голосовые системы уже повсеместно внедряются для помощи человеку. Рассмотрим, например, голосовой помощник «Аэрофлота». Допустим, что нам нужно срочно вернуть билеты в связи с форс-мажорными обстоятельствами. Как только мы дозвонимся до диспетчерской, автомат попросит нас сообщить цель звонка — по сути, мы видим (концептуально) ту же систему, что и в случае с Алексой, только более специализированную. Мы произносим что-то похожее на «вернуть билеты срочно» и начинаем говорить с ботом, используя его же функциональные термины («категория» + «модификатор»), вставляя ключевые «поисковые» слова в простой язык запросов. И это, безусловно, эффективно, т. к. экономит время операторов первой линии, но возвращает нас к уже прозвучавшему ранее тезису: сначала мы обучаем машины, а потом сами машины учат нас, как с ними говорить. Главное здесь — помнить, что человек решает, что, как и зачем происходит.
В связи с этим появляются вопросы: не станет ли наш язык в результате интеграции с системами искусственного интеллекта более структурированным? Должны ли мы вообще говорить с ИИ так, как говорим с ним сейчас, или пусть боты подчиняются нашему интуитивному и эмоциональному языку, самостоятельно переводя его в логичную, графовую форму? И не это ли имел в виду Хомский в своей универсальной грамматике?
Умные помощники: граф знаний
Как именно Алекса поняла, что Random Access Memories — это альбом, а не песня? Как правило, подобные системы используют knowledge graphs — представление знаний в логической форме.
Таким образом, мы зафиксировали, как должны быть представлены знания, чтобы система могла их извлечь. Вернемся к основному тезису: сначала человек научил систему, как представлять знания, а потом стал следовать машинному представлению, чтобы получить эти данные из системы.
Умные помощники: Natural Language Processing
Картинка из OpenAI: better language models
Но как система идет от набора звуков к буквам и смыслам, которые за ним стоят? Идеи в основе таких систем, как Word2Vec, BERT (RoBERTa, etc), восходят своими корнями еще к Людвигу Витгенштайну: «Значение слова — это его употребление в контексте» (Die Bedeutung eines Wortes ist sein Gebrauch in der Sprache).
Система изучает контексты и может оперировать с ними, как с алгебраическими величинами:
Особенность BERT в том, что эта технология умеет учитывать так называемые правые и левые контексты — например, для слова bank ниже:
Таким образом, каждое слово представляется в виде совокупности контекстов, в которых оно может использоваться. В частности, в машинном представлении контекст — это N-мерный вектор, а значит, слово может быть представлено в виде радиус-вектора в N-мерном пространстве, например:
Подобным представлением и пользуются многие NLP-системы для поиска и анализа большинства запросов, а также ответов на вопросы. Например, если задать Алексе вопрос: «Who was the president before Obama?», она сможет распознать контекст выборов в США даже без упоминания страны, а также понять, что нам необходим человек, бывший президентом до личности, упомянутой в запросе, и корректно ответить: «Barack Obama was preceded as the president United States by the George W. Bush».
Продолжать тему можно бесконечно, но, наверное, актуальный путь ее развития — это движение в сторону плотного взаимодействия человека и ИИ. Еще одним шагом на пути прогресса в этой отрасли станет технологический конкурс Up Great. Похоже, вопрос о роли ИИ в жизни человека постепенно находит свое окончательное решение.
Развитие искусственного интеллекта, как и его восприятие человеком, прошло сложный путь и продолжается на наших глазах. ИИ давно вырос из коротких штанишек простого помощника человека и все активнее заявляет о своих правах. Стартующий в 2019 году технологический конкурс Up Great ставит перед собой долгосрочную амбициозную цель — создать универсальный ИИ, который будет обучаться вместе с людьми в ходе совместной деятельности. А это значит, что пришло время окончательно решить, кем является ИИ для человека и кем человек является для ИИ.

Шахматы
Одиннадцатое мая 1997 года. Нью-Йорк. Мир шахмат изменился навсегда. Машина победила человека. Стало понятно: игра уже не будет прежней — машина сильнее. Спустя годы Гарри Каспаров поедет по миру и в лекциях будет вспоминать о том, какими были шахматы и какими стали сегодня.
«Играя с машиной, ты словно играешь с пятиклассником — только в конце ты проигрываешь», — вспоминает он. Типичная игра компьютера отличается от человеческой: это прежде всего тактика и стратегия, основанная на последовательном получении маленького и едва заметного преимущества в каждом шаге. Горизонт планирования и расчета по дереву решений у человека и машины существенно отличается. Магнус Карлсен утверждает, что видит в среднем на 15, а иногда на 20 ходов вперед (не endspiel) — современные компьютеры могут обсчитать на порядок большее число шагов. Заметим, что для создания подобной системы необходимо иметь два ключевых элемента: функцию оценки доски и алгоритм обхода дерева возможных решений.
Первый модуль говорит нам, насколько хороша данная расстановка фигур для нас, а второй, модуль поиска, используя эту функцию, смотрит на возможные N шагов вперед и пытается найти наиболее выгодный шаг. Частой эвристикой и эффективным алгоритмом поиска является альфа-бета отсечение, а также стохастический метод Монте-Карло поиска по дереву. В чем соль? Мы играем в игру min-max: мы хотим сделать такой шаг, чтобы полученная доска была оптимальна для нас, а ответный шаг был минимален. Для этого мы просчитываем все возможные ответы оппонента, рассчитывая, как на них можно максимально эффективно ответить. Для этого нам нужно перейти на глубину n+1 и заново рассчитать min-max. Повторяя эту операцию N раз, мы можем узнать оптимальное для нас состояние доски через 2*N шагов (или N наших шагов).
Evaluation function — как правило, набор экспертных эвристик, оценивающих качество доски для нашего игрока
Каспаров говорит, что сейчас все профессионалы тренируются с машинами: «Когда-то это было невозможно себе представить — правила игры поменялись». К сожалению, многие слепо следуют в тренировках советам машин. Как наставник Магнуса он отмечает, что прежде всего того отличает от других игроков в шахматы способность «прочувствовать» логику машины во время тренировки.
Когда-то мы учили машины «видеть» доску и «находить» лучший ответ на действия оппонента, а сейчас на основе этих алгоритмов, которые вдохновлялись видением и тактикой шахматистов и были основаны на человеческом опыте игры в шахматы, мы обучаем будущих и настоящих игроков в шахматы. Круг замкнулся?
На самом деле все куда интереснее, ведь связки «человек + машина», как правило, сильнее, чем человек или машина в отдельности. И здесь мы видим совершенно новое направление augmented intelligence. Подобные шахматы получили название advanced chess. Вышла невероятно интересная игра: взаимодействие машинной и человеческой логики.
Всегда ли машины работают на строгом расчете? Или у них есть «интуиция»?
αГо и триумф машинного обучения
Девятое марта 2016-го. Сеул. Практически никто из профессиональных игроков не верит, что легендарный Ли Седоль может проиграть машине в го — ведь это «священный Грааль» игр и самая сложная из настольных игр с открытой информацией.
На каждый шаг в шахматах есть 20 осмысленных переходов-ответов. В го их около 200. Это означает, что всего через несколько шагов число возможных комбинаций превышает число молекул в обозримой вселенной. Ниже приведен план «раскрытия» дерева возможных решений во времени (по шагам — слева направо).
Общая стратегия, как мы видим на схеме ниже, похожа на алгоритм поиска.
  1. Выбор (Selection). Симулирует обход дерева, выбирая дуги с максимальным весом Q (насколько хорош шаг).
  2. Раскрытие вершины (Expansion). Если вершина выбрана при обходе, она скармливается supervised learning (SL) policy network для получения априорных вероятностей возможных шагов.
  3. Оценка (Evaluation). Включается Reinforcement Learning стратегия, которая играет множество игр и оценивает, насколько текущая позиция хороша (условно, если белые выиграли у черных 8 из 10 раз начиная с данной расстановки, то вес позиции — 0,8).
  4. Backup. Приписываем вес всему дереву и продолжаем поиски.
Нейросети играют роль «интуиции» машины. Если в случае с шахматами в деле строгая логика, то здесь просчитать ходы невозможно.
В документальном фильме про AlphaGo мы видим, как система играет на 5-й линии. Шаг 37. Комментатор говорит, что это ошибка человека за столом. Приходит ответ системы: «Нет, это не ошибка». Корея замирает. Эксперты меняются в лице. Ли уходит покурить. Мир Го перевернулся навсегда.
Шаг 37 AlphaGo — игра на пятой линии
Это был всего лишь расчет, точный и кропотливый. Если Каспаров говорил, что машина — это школьник-пятиклассник, то в этот момент пятиклассником оказался сам мир.
В одной-единственной игре, возможно, последней, когда человек победил машину в Го, Ли Седоль делает свой 78-й ход. Машина говорит, что такой ход фактически невозможен — так никто никогда бы не пошел. Этот ход назовут «прикосновением Бога».
Шаг 78: Ли Седоль — «прикосновение бога»
Ход 37 был всего лишь расчетом, а ход 78 — откровением, актом человеческой интуиции, творчества и даже искусством, но без хода 37 не было бы и хода 78. Не делает ли это его чем-то большим, чем просто расчет? Не узнали ли мы о себе что-то, чего никогда не узнали бы без машин?
Может быть, это станет переходом из фазы «человек против машины» в фазу «человек и машина»?
Игры: что дальше?
Почему игры вызывают такой интерес? Сейчас понятно, что для того, чтобы решать реальные жизненные задачи, нужно абстрактное мышление и математика, что почти не требует общих знаний о физическом мире. Возможностей компьютеров пока (пусть и есть какие-то примеры) не хватает для моделирования всего мира. А игры — это интересная абстракция части существующего мира, и в них можно играть эффективно. Именно поэтому такая ситуация стала одним из бенчмарков развития искусственного интеллекта.
Сейчас мы видим, как DeepMind, OpenAi и многие другие покоряют новые горизонты.
На подходе системы, которые могут ориентироваться в пространстве и взаимодействовать с друг другом (например, Dota и StarCraft), используя совершенно разные стратегии, тактики и доступные ресурсы — безусловно, все это необходимо для применения подобных систем в реальной жизни.
Интересный инсайт: в такой игре, как StarCraft, обладая возможностью быстро и безошибочно контролировать и координировать действия, простые линейные юниты побеждают даже самые сложные комбинации созданий и существ. Это поможет упростить дизайн сложных инженерных систем, которые мы создаем сейчас.
Ну а DeepMind просто натренировал идеально скоординированную армию роботов-убийц — нет никаких поводов для волнений.
Реальная жизнь и взаимное обучение с ИИ: умные помощники
Стоит нам произнести: «Alexa Spotify Random Access Memories by Daft Punk», как заиграет хорошая музыка.
А тем временем сложилась целая цепочка решений, принятых несколькими разными системами искусственного интеллекта. Первый слой — голосовой модуль — преобразовал записанный звук в отдельные слова. Затем внутренняя система обнаружила команду активации.
Выделим ключевые аспекты процесса:
  • Команда активации — Alexa;
  • Команда выбора модуля — музыкальный модуль Spotify;
  • Spotify query template matching <album> by <artist> — тут подсистема поняла, что у нас запрос вида <music> by <performer> и что в данной ситуации <music> является альбомом, а <performer> — группой.
И тут случается что-то невероятное. Сначала мы учим помощника понимать человеческую речь, общаясь с ним так, как с обычным человеком, но потом незаметно для себя мы переходим на искусственный язык запросов.
Кому-то пример с голосовым помощником может показаться надуманным (pun intended), ведь совсем не обязательно пользоваться системой в духе Алексы или Алисы. Но автоматические голосовые системы уже повсеместно внедряются для помощи человеку. Рассмотрим, например, голосовой помощник «Аэрофлота». Допустим, что нам нужно срочно вернуть билеты в связи с форс-мажорными обстоятельствами. Как только мы дозвонимся до диспетчерской, автомат попросит нас сообщить цель звонка — по сути, мы видим (концептуально) ту же систему, что и в случае с Алексой, только более специализированную. Мы произносим что-то похожее на «вернуть билеты срочно» и начинаем говорить с ботом, используя его же функциональные термины («категория» + «модификатор»), вставляя ключевые «поисковые» слова в простой язык запросов. И это, безусловно, эффективно, т. к. экономит время операторов первой линии, но возвращает нас к уже прозвучавшему ранее тезису: сначала мы обучаем машины, а потом сами машины учат нас, как с ними говорить. Главное здесь — помнить, что человек решает, что, как и зачем происходит.
В связи с этим появляются вопросы: не станет ли наш язык в результате интеграции с системами искусственного интеллекта более структурированным? Должны ли мы вообще говорить с ИИ так, как говорим с ним сейчас, или пусть боты подчиняются нашему интуитивному и эмоциональному языку, самостоятельно переводя его в логичную, графовую форму? И не это ли имел в виду Хомский в своей универсальной грамматике?
Умные помощники: граф знаний
Как именно Алекса поняла, что Random Access Memories — это альбом, а не песня? Как правило, подобные системы используют knowledge graphs — представление знаний в логической форме.
Таким образом, мы зафиксировали, как должны быть представлены знания, чтобы система могла их извлечь. Вернемся к основному тезису: сначала человек научил систему, как представлять знания, а потом стал следовать машинному представлению, чтобы получить эти данные из системы.
Умные помощники: Natural Language Processing
Картинка из OpenAI: better language models
Но как система идет от набора звуков к буквам и смыслам, которые за ним стоят? Идеи в основе таких систем, как Word2Vec, BERT (RoBERTa, etc), восходят своими корнями еще к Людвигу Витгенштайну: «Значение слова — это его употребление в контексте» (Die Bedeutung eines Wortes ist sein Gebrauch in der Sprache).
Система изучает контексты и может оперировать с ними, как с алгебраическими величинами:
Особенность BERT в том, что эта технология умеет учитывать так называемые правые и левые контексты — например, для слова bank ниже:
Таким образом, каждое слово представляется в виде совокупности контекстов, в которых оно может использоваться. В частности, в машинном представлении контекст — это N-мерный вектор, а значит, слово может быть представлено в виде радиус-вектора в N-мерном пространстве, например:
Подобным представлением и пользуются многие NLP-системы для поиска и анализа большинства запросов, а также ответов на вопросы. Например, если задать Алексе вопрос: «Who was the president before Obama?», она сможет распознать контекст выборов в США даже без упоминания страны, а также понять, что нам необходим человек, бывший президентом до личности, упомянутой в запросе, и корректно ответить: «Barack Obama was preceded as the president United States by the George W. Bush».
Продолжать тему можно бесконечно, но, наверное, актуальный путь ее развития — это движение в сторону плотного взаимодействия человека и ИИ. Еще одним шагом на пути прогресса в этой отрасли станет технологический конкурс Up Great. Похоже, вопрос о роли ИИ в жизни человека постепенно находит свое окончательное решение.

Комментарии (33)


  1. h3j3j
    12.12.2019 22:25

    >Рассмотрим, например, голосовой помощник «Аэрофлота»
    Ненавижу чатботов и голосовых помошников. Если я звоню в банк и мне отвечает машина я чувствую что на мне сэкономили и впарили ширпортреб. Это как баланда в дешевой столовке.
    Кроме того, я человек в достаточной степени сообразительный чтобы простую информацию найти самому и если я звоню в поддержку — значит у меня достаточно сложный вопрос, на который и поддержка не всегда сразу ответит. И вместо того чтобы этот вопрос решать, я должен биться головой в голосового помощника. Это жесть и фрустрация.


  1. Antizavr
    13.12.2019 18:27
    +3

    Грубо говоря, здесь речь идет об экспертных системах, искусственный интеллект на текущем уровне техники — это фантастика.


    1. QDeathNick
      18.12.2019 00:43
      -3

      А говоря менее грубо, здесь речь идёт об интеллектуальной системе, способой успешно выявить смысловые и фактические ошибки в академическом эссе на уровне специалиста в условиях ограниченного времени.
      Как мне кажется, за это сойдёт даже набор regexp, сгенерённый на основе генетического алгоритма. Главное генерить в районе SK Сколково и тогда приз ваш.


  1. dougrinch
    15.12.2019 12:48
    +4

    > Интересный инсайт: в такой игре, как StarCraft, обладая возможностью быстро и безошибочно контролировать и координировать действия, простые линейные юниты побеждают даже самые сложные комбинации созданий и существ.

    Только вот работает это только в ситуациях, подобных тем, на которых AI учился. А в любой новой нестандартной он начинает тупить и делать вещи, абсурдность которых человеку очевидна. www.youtube.com/watch?v=mpAUufSzaUo


    1. Treviz
      18.12.2019 00:16
      +3

      В Старкрафте ДипМайнд стал резко проигрывать середнячкам (даймонд лига) после лишения только половины читерских возможностей.


  1. Kilorad
    16.12.2019 12:52
    +1

    Reinforcement Learning пока ещё работает довольно плохо.
    habr.com/ru/post/437020
    Есть отдельные впечатляющие достижения, но обычно это результат очень ручного серьёзного дотачивания системы под задачу.
    Чего-то надёжного, типа XGBoost, но для RL пока не сделали, к сожалению


  1. allbom
    19.12.2019 10:36
    +3

    В шахматах выбор не такой уж и большой, 20 — это максимально возможное число на первом ходу, а осмысленных из них не больше 12 и число их не растет, а уменьшается. Но шахматы — игра счетная и делать это надо постоянно, человек проигрывает когда устает и пропускает удар. В Го же большее значение имеет интуиция и если компьютер начал выигрывать в Го — пора звать семейку Конноров.


    1. Alexey_mosc
      20.12.2019 15:37
      +1

      Хаха: Конноров.


    1. dom1n1k
      23.12.2019 01:30
      +1

      Почему число ходов уменьшается? Фигур становится меньше, но за счет опустения доски у них становится больше вариантов движения. Условно говоря, в исходной позиции у коня всего 2 варианта хода, а в эндшпиле в центре почти пустой доски — 8. Ладья, слон, ферзь в эндшпиле легко могут иметь больше десятка возможных ходов на одну фигуру.


      1. allbom
        23.12.2019 04:27
        +1

        Возможных ходов — больше, осмысленных — меньше. Stockfish оценивает 70 миллионов позиций в секунду, разорвавший его AlphaZero от DeepMind — 80,000/сек., на 99.89 процентов позиций меньше.
        (https://www.chess.com/ru/article/view/kak-ustroen-shakhmatnyi-mozg-alphazero):
        … проблемой шахмат является взрывное ветвление вариантов. Расчет на два хода вперед из дебютной позиции требует оценки 150,000 позиций и с увеличением глубины это количество растет экспоненциально. AlphaZero сокращает количество вариантов, рассматривая только ходы, рекомендованные ее стратегической сетью. Она также использует оценочную сеть, чтобы прекратить изучение вариантов с ясной оценкой (победа/поражение).
        Допустим, что стратегическая сеть предлагает в среднем по три заслуживающих внимания хода в каждой позиции. При скорости 80,000 позиций в секунду, которую использует AlphaZero, за минуту она заглянет на семь полных ходов вперед...


        1. dom1n1k
          23.12.2019 11:08
          +1

          Главная проблема не ветвление вариантов, а функция оценки позиции. Чтобы как раз отличать возможные ходы от осмысленных. Это самое сложное и именно в этой части прорыв у Альфы.


        1. Akon32
          31.01.2020 18:36

          свой тупой язык достаточно умным людям

          И эти "достаточно умные люди" изъясняются неоднозначными фразами ("Ты где?" — "Я щас буду"), сами не понимают друг друга, а потом жалуются, что это ИИ тупой.


          попытки создать новый мировой язык

          Увы, это никому не нужно. Есть английский, мировой дефакто. В принципе, вместо него мировым может быть любой другой язык, как только получит распространение. Очередной новый язык обычно не вносит ничего нового, не имеет "киллер-фич", не имеет того, что нельзя выразить более стандартным языком.


          вследствие распостранения голосового ввода из английского стремительно уходят знаки препинания

          Да? Я помню, в английском было куда меньше запятых, чем в русском, даже до голосового ввода.


  1. anonymous
    00.00.0000 00:00


    1. marksv
      08.01.2020 23:38
      +1

      Смайлы / стикеры в соц. сетях и мессенджерах уже съели часть живых эмоций :D


  1. anonymous
    00.00.0000 00:00


    1. Akon32
      28.01.2020 04:56
      +1

      Так значит, стройность и однозначность бинарного лингва технис вы не одобряете?


      Между тем, хорошие приказы, как и хорошие отчёты, должны интерпретироваться правильно, полно и однозначно. Языки программирования тому пример. А SQL — ещё и пример попытки создания человекочитаемого языка программирования.
      Не вижу ничего плохого в том, чтобы вместе с естественным языком учить некий универсальный язык запросов для плотного взаимодействия с любой техникой. Сейчас тыкать пальцем в планшет, вроде бы, учатся раньше, чем говорить, но этого, наверно, недостаточно для чёткого изложения любых мыслей.


  1. anonymous
    00.00.0000 00:00


  1. anonymous
    00.00.0000 00:00


  1. Akon32
    03.02.2020 16:02

    [саркастически] ну ага.
    При создании языка можно предусмотреть теги эмоций)


    Но зачем это всё (эмоции) при общении с роботом? У вас есть сообщение роботу, вы преобразовываете своё сообщение в несколько бит данных, чтобы робот корректно понял сообщение и сделал именно то, что вам нужно. Вы не хотите, чтобы робот понял вас неправильно. Логично предусмотреть надёжную и однозначную систему сообщений. Глупо кодировать сообщения кодом без спецификации (эмоциями). У некоторых предрасположенных людей, я слышал, подобные неоднозначности могут даже спровоцировать шизофрению. После команды "АЛИСАААА !!!" робот же с некоторой вероятностью сделает не то, что вам нужно. Человек, кстати, тоже.


  1. anonymous
    00.00.0000 00:00


  1. Akon32
    06.02.2020 11:32

    Уровень срочности / важности.

    Для этого придумали числа запись приоритета числами. Опять же, каждую фразу несложно тегировать.


    Да не в этом суть. Команды должны быть однозначны, тогда как эти ваши "характеры звукоизвлечения" у животных неоднозначны и имеют неписаные правила. Если какой-то пользователь привык орать и слюной брызгать, отдавая приказы, это не значит, что приказ другого пользователя, сказанный монотонно, можно не выполнять.


  1. PavelMSTU
    23.12.2019 18:07
    -1

    А игры — это интересная абстракция части существующего мира

    Нет, автор. Игры — это игры.

    Но как система идет от набора звуков к буквам и смыслам, которые за ним стоят?
    Никак, читаем Джона Сёрля.

    Продолжать тему можно бесконечно, но, наверное, актуальный путь ее развития — это движение в сторону плотного взаимодействия человека и ИИ.

    Нет. Путь — дальнейшая автоматизация под «хайп» и соус Data Science.


  1. Dabbuger
    25.12.2019 16:20
    +1

    я не знаю, правильно ли возмущаюсь, но всё же не машина нас учит, а программист (создатель железки, программы и т.д.), посредством машины, учит нас как ей пользоваться.

    Не книга же нас учит, а её автор.


    1. Akon32
      28.01.2020 04:34
      +1

      По поводу формализованных подмножеств языка вы, наверно, правы — структура фраз задаётся создателями этих языков. С другой стороны, типичные сценарии взаимодействия с компьютером, например раскладка клавиатуры, использование мыши, концепция ctrl-c ctrl-v, за много лет наверно настолько "выжигаются" в нейронной сети мозга, что их можно считать отдельным языком, и уже не разобраться, кто научил этому языку.


      Гораздо интереснее случаи с "чистыми" реализациями ИИ в том же го (alpha zero и подобные). Тут программируются лишь правила игры, а не умение играть. Умение играть вычисляется машиной. И потом живые игроки 9 дана учатся именно у машины, а не программистов, её создавших, т.к. те программисты не понимают игру настолько хорошо, чтобы учить топовых игроков.


    1. Nashev
      29.01.2020 08:00

      Автор задаёт чему можно научиться, а учит нас то, что проверяет ответы и даёт на них обратную связь. Таки машина. Ей приходится говорить так, чтоб она отреагировала желаемым поведением


  1. MaxLevs
    30.12.2019 09:10
    +1

    Я так и не понял, чем так прославились 37 и 78 ходы? (слишком много энтимемов)
    Посмотрел представленные кусочки документалки, но "ответов системы" не заметил. (мой англлийский)
    Подскажите, пожалуйста, почему 37 ход так шокировал людей, а 78 стали звать "прикосновением бога"?


    1. Akon32
      28.01.2020 04:11
      +1

      Про 37й ход 2й игры — машина сделала хороший ход "креативно", не по канонам, которых известно достаточно для начального этапа игры, чем всех удивила.


      78й ход Ли Седоля в 4й игре оказался неожиданным для машины. После этого оценка позиции машины упала, машина начала делать плохие ходы и через несколько десятков ходов сдалась. Это было последним случаем, когда человек победил машину. Следующие версии машины, основные не на человеческом опыте, а на чистых правилах игры (zero), уверенно побеждали всегда, и человек вряд ли когда-нибудь ещё победит. (я имею в виду конфигурации alpha go и alpha go zero, играющие на полной мощности, в отличие от их свободных клонов типа leela zero, которые каждый волен запускать хоть на чайнике, и тогда их легко победить).


      1. MaxLevs
        02.03.2021 15:11

        А можно по-конкретнее, какие каноны обошла альфа на 37-м ходу? Я не искушён игрой Го, и для меня это просто "поставь камень рядом с камнем противника", но в документалке диктор на этом моменте начинает с восхищением рассказывать про связанность всех позиций в игре.


        1. Akon32
          03.03.2021 07:19

          Судя по фильму, все комментаторы сошлись во мнении, что этот диагональный ход по 5й линии — это слишком далеко от края доски, они говорят "так не играют". У противника камень на 4й линии создаёт возможность взять слишком много пунктов территории на правой стороне, и надавливание по 5й линии не ведёт к существенному уменьшению территории тут.
          С другой стороны, это надавливание блокирует выход белых в центр и неплохо уменьшает влияние белых по правой стороне на центр… Такое "надавливание сверху" (вроде бы) часто применяется, по крайней мере по 4й линии и в эпоху после-AlphaGo.
          Но, конечно, профессионалам и сильным программам виднее, их так просто не понять.


  1. agmt
    30.12.2019 09:12
    +2

    И тут случается что-то невероятное. Сначала мы учим помощника понимать человеческую речь, общаясь с ним так, как с обычным человеком, но потом незаметно для себя мы переходим на искусственный язык запросов.

    Человек-человек системы тоже приходят к искусственному языку, если требуется точность передачи запроса и жесткое временнОе ограничение: общение с авиадиспетчером, отправка торговых заявок, отправка сообщений на пейджер (пытался отправить в детстве сообщение: операторши скидывали звонок несколько раз — видимо, не по шаблону и медленно говорил).


  1. YernarShambayev
    08.01.2020 09:24
    +1

    Вообще, честно говоря, сложилось впечатление, что автор поверхностно разбирается в теме программирования логических настольных игр (или, по крайней мере, неглубоко в ней).

    «Магнус Карлсен утверждает, что видит в среднем на 15, а иногда на 20 ходов вперед (не endspiel) — современные компьютеры могут обсчитать на порядок большее число шагов.»

    «На порядок больше» — это, как минимум, в 10 раз. Считать на 150-200 ходов современные машины не в состоянии и вряд ли будут в обозримом будущем. Считать на 150 ходов — это значит из начальной позиции увидеть, чем закончится партия, и фактически закрыть тему шахмат.

    Лучшие современные движки считают в середине партии в среднем на 50-60 полуходов (!!), то есть на 25-30 ходов. Причем ветки в переборе разной глубины (где-то сокращаются всякими prunings и reductions, где-то продлеваются, например, quiescence search) Это много, это далеко, но это еще не закрывает тему шахмат. Компьютеры могущественны, но и с человеком на данном этапе развития нужно считаться (поэтому матчи «человек + машина» против «машины» заканчиваются в пользу адванса). Не удивлюсь, если выяснится, что и Leela Zero играет далеко не идеально.

    Проблема подобного рода статей — в том, что их, к сожалению, пишут не спецы, а люди, просто интересующиеся темой. А так хотелось бы почитать взгляд на данную проблему от русскоязычных разработчиков Белки/Стрелки, Greko, Gull, WildCat и проч.

    Извините, если излишне критичен.


  1. kalisto74
    23.01.2020 07:13
    +1

    Спасибо Вам за то, что поделились видением.
    Согласна как с одним из вариантов будущего — вначале человек учит машину, но потом машина учит человека. И это взаимообратимо бесконечно.
    Правда многообразие жизни предполагает и другие варианты и их много.
    Да наступило время взаимосотрудничества с алгоритмами по всем областям. Я осознаю, что как вариант человек не станет особо необходим в экономической сфере по многим профессиям. И с другой стороны острая нехватка квалифицированных людей. Не только в плане интеллекта а в плане расширения сознания. Я смотрю на себя, на меняющийся мир и делаю выводы — видеть алгоритмы в своих мыслях, поступках, различать эмоциональную составляющую и логическую в себе. Раскрывать в себе скрытый потенциал — прислушиваясь и присматриваясь глубже. Я вижу как на работе я концентрируюсь на том, что делаю. Я словно машина, которая сама приняла в действие ряд этапов по решению задачи. Я вижу когда еду или отдыхаю — как хочется впитать все, что удивляет меня и наполняет. Я вижу как летит время — перемены ускоряются. И конечно мне любопытно очень интегрироваться с алгоритмами — интересно. Как ребенок жизни я фантазирую где и как автоматизировать что либо. А где раскрыть свой потенциал человеческий — интуицию, чтение мыслей, гипноз и другое.


  1. me21
    30.01.2020 08:13

    "Главное здесь — помнить, что человек решает, что, как и зачем происходит."


    Это пока :-)