Биткоин-бот имени Дональда Трампа, победа AlphaGo над одним из сильнейших игроков в го Ли Седолем, изучение английского языка — что объединяет эти три ситуации? Везде в той или иной степени присутствует машинное обучение.

Компьютер может не только генерировать сюжетную канву, как Scheherazade, или отвечать на письма вместо пользователей, как Google Smart Reply, но и создавать идеальные учебники английского языка.


В помощь учителю


В Skyeng все учителя ведут уроки при помощи интерактивной онлайн-платформы Vimbox. Все материалы урока, упражнения, тексты, аудио- и видеофайлы хранятся на платформе. Урок на Vimbox спланирован буквально по минутам: учитель видит подсказки о том, какие вопросы задать ученику, как лучше отработать упражнение и что задать на дом. Занятия проходят в интерактивном формате – учитель видит, как ученик выполняет упражнения, какие слова добавляет в словарь и какие грамматические конструкции вызывают у него трудности; при этом он может оперативно помочь, объяснить нужную тему.

В процессе собирается большой объем статистических данных. Платформа фиксирует все действия ученика и учителя – сколько они разговаривали, на каком языке, как быстро ученик делал упражнения, какие у него получились ответы и где учитель ему помогал. Мы можем оценить объем домашнего задания, скорость взаимодействия с текстами и упражнениями, объем объяснений, количество прослушанных записей и много других параметров взаимодействия учителя и ученика на уроке. Ученик же может дать оценку и материалам урока, и преподавателю (эту оценку учитель не видит).



Этот массив данных служит помощником для преподавателя. Перед каждым уроком система напомнит ему, каким объемом лексики владеет ученик, с какими проблемами пришлось столкнуться на предыдущих занятиях, какие задания были выданы и насколько быстро студент с ними справился и т.д., вплоть до его интересов и хобби. Это важное подспорье, поскольку преподаватель не может помнить все подробности про каждого своего ученика. Однако пока учитель анализирует эту информацию самостоятельно и выстраивает урок на основании собственных выводов. Может ли ему помочь обучающаяся машина?

Мы считаем, что да. Объем собираемой во время уроков информации настолько велик, что учитель просто не сможет всю ее переварить за пять минут подготовки к уроку. А машина – вполне. Мало того, она может сравнить данные конкретного студента с базой данных по всем ученикам, выявить закономерности, и на основании всего этого массива анализировать текущий урок «на лету», выдавая преподавателю подсказки: с этой грамматической конструкцией у студента будут проблемы, заостряем на ней внимание; это задание можно пропустить, потому что оно не вызовет никаких трудностей, заменяем его вот этим; эта тема ученику интересна, а с этой он, скорее всего, «закроется» и т.д. Обучающаяся машина становится своего рода вторым, закулисным преподавателем, повышающим эффективность урока.

Применение машинного обучения выгодно нам и коммерчески:
— экономится время преподавателей и методистов. ИИ может взять на себя как рутинную работу, так и базовую аналитику;
— повышается эффективность преподавателей. Машина всегда подскажет, если учитель что-то забыл, пропустил или допустил ошибку;
— перед нами открывается масса новых возможностей. Мы можем создавать уникальные продукты, недоступные нам ранее;
— наконец, мы с полным основанием можем рассказывать о своей высокотехнологичности в маркетинговых материалах.

Семантический анализ


Еще одна задача из области изучения языка, которую можно успешно решить машинным обучением – создание семантического анализатора. Предположим, вы читаете текст на любимом веб-сайте или пост в социальной сети. Вам попадается незнакомое слово на английском, нужен его перевод в данном контексте. Не все варианты значения слова, представленные в англо-русском словаре, и не машинный перевод всей фразы, а именно перевод данного слова в данном месте. Семантический «парсер» анализирует все слова в тексте и связи между ними, делает разметку, чтобы выудить релевантное значение нужного слова.
Забивать все возможные семантические связи вручную – задача практически невыполнимая. Здесь нам тоже на помощь приходит машинное обучение. Учитель в ходе обычного урока просто «подправляет» автоматический перевод, а анализатор, просмотрев окружающий текст, старается обнаружить и запомнить все закономерности. Несколько таких поправок – и результат перевода становится близким к идеальному.

Семантический анализатор поможет читать тексты, сразу получать релевантные переводы и добавлять слова в нужном значении в персональный словарь. В Vimbox словарь функционально связан с мобильным приложением, которое используется для повторения слов между уроками. Работа мобильного приложения основана на алгоритме, который копирует системность работы долговременной памяти, поэтому заучивание слов происходит не рандомно, а с определенными интервалами. Но это темя для отдельной публикации, которую мы тоже готовим.

Идеальный учебник


Процесс улучшения содержания учебных материалов – важная задача, которой озабочены все мировые издатели учебников, такие как Oxford University Press, Macmillan, Cambridge и Pearson. Неоценимую помощь в этом деле оказывает богатая статистическая база о взаимоотношениях ученика и учителя, собранная школой Skyeng.

Мы проанализировали 308 000 уроков, проведенных на платформе Vimbox, и пришли к интересным выводам. Например, есть упражнения, которые учителя регулярно пропускают и не задают своим ученикам. Есть упражнения, где количество правильных ответов достигает 98%. Мы задались вопросом – в чем смысл таких упражнений, не являются ли они слишком легкими и очевидными с точки зрения ученика? Несут ли они педагогический эффект?


Преподаватель пропускает то или иное упражнение на основе собственных опыта и интуиции. Используя алгоритмы машинного обучения и накопленные данные, мы можем создать систему, имитирующую опыт и интуицию сразу всех наших преподавателей, и создать с ее помощью «идеальный урок» для каждого ученика, а из таких уроков – персонифицированый «идеальный учебник».



В обучении английскому можно анализировать учебник и составить какое-то подобие Google Knowledge Graph. Например, в какой последовательности повторяется ранее пройденный материал, как лексический, так и грамматический, правильно ли идет изучение грамматики, насколько взаимосвязаны изучаемые темы. Можно выявлять оптимальную длину аудирования для того или иного уровня знания английского, настраивать показ видеороликов, оптимальную модель чередования письменных и устных упражнений – все это будет возможно при помощи машинного обучения. Мы сможем анализировать типичные ошибки в письменных работах учеников в нашем инструменте Эссе и проверять работы в полуавтоматическом режиме с выдачей подсказок для оптимизации работы.

Мы пока находимся в самом начале пути, поэтому активно интересуемся всеми современными наработками в области машинного обучения, стараемся участвовать в экспериментах, связанных с этой темой. Один из таких экспериментов – конкурс BlackBoxChallenge, партнером которого является школа Skyeng. Знатоки языка Python могут попробовать свои силы в создании искусственного интеллекта – агента, отправляющегося в Черный Ящик, где его ждут неведомые приключения и загадки. На входе участники не имеют никакой информации о том, что происходит в Ящике, и им нужно создать Агента, который сможет сам научиться играть в игру с неизвестными правилами.
Конкурс уже подходит к концу — прием решений завершается 30 мая.

Призовой фонд составляет 600 000 рублей, сейчас за него борются около 1280 человек.
Поделиться с друзьями
-->

Комментарии (10)


  1. SerCe
    20.05.2016 12:10
    +1

    Есть ли какие-нибудь подтверждения того, что ваша система действительно работает лучше, чем нормальный урок по скайпу, на том же italki, где преподаватель уделяет вам все время и может вести урок в любом необходимом направлении, не отвлекаясь на 3 мин. грамматки, 3 минуты другое и т.д?

    Без подтверждения для меня такой подход выглядит как «макдональдс» — все под копирку, откровенно плохого результата вы не получите, но и особо хорошего тоже ждать не стоит.

    Эту оценку учитель не видит

    Как же тогда ему получать фидбек, хотя бы текстовые отзывы есть?


    1. alexwal
      20.05.2016 12:15

      Есть подтверждения с точки зрения LT: уроки на платформе ученик покупает в два раза больше, чем по скайпу (3 месяца vs 7).


      1. SerCe
        20.05.2016 13:30

        Возможно, это значит, что пользователь добился нужных результатов за 3 месяца, вместо 7?


        1. alexwal
          20.05.2016 14:37
          +1

          У нас была такая гипотеза, протестировали. Ну то есть, просто так из своего кармана выкладывать $1.5M в платформу без проверки гипотез было бы глупо :)


          1. SerCe
            20.05.2016 19:03

            Придерусь, но в такой формулировке 7 месяцев для вас прибыльнее, независимо от того лучше это для пользователя или худше.


            1. alexwal
              20.05.2016 19:59

              Тогда бы у нас не было 30% продаж через «приведи друга». На коротком промежутке времени можно обмануть людей, но если они не чувствуют прогресс, то перестают платить и никому не рекомендуют.


    1. Ontaelio
      20.05.2016 12:38

      Добавлю, что у нас тоже преподаватель уделяет все время урока ученику и может вести его в любом направлении. Платформа — не рельсы, учителя могут сами выбирать нужные уроки и задания. Мало того, у нас есть небольшое количество учеников, по-прежнему занимающихся по скайпу: они решают свои уникальные задачи, создавать под которые уроки бессмысленно.

      Это, впрочем, исключения. В большинстве случаев разработанная, проверенная и протестированная программа представляет собой наиболее эффективный путь к знанию языка (это, кстати, не мы придумали). И здесь как раз можно использовать машинное обучение, поскольку есть достаточно большая статистическая база.


  1. engune
    20.05.2016 15:42

    Очень часто при оплате Яндекс.Деньги предлагают SkyEng. Раньше это было 1 урок бесплатно, недавно 4 предлагали. Когда предложили 1 урок тестовый, я прошел. Пришел к выводу, что оффлайн обучение лучше — с репетитором.


    1. SerCe
      20.05.2016 16:16
      -1

      А я вот вступлюсь за уроки по скайпу. Использую italki, для меня решающими стали 2 фактора:


      • Невозможно каждый день тратить много времени на то, чтобы добраться до репетитора, а также невозможно иметь гибкое расписание. Со скайпом возможно тратить час каждый день, при этом ставить в расписание уроки тогда, когда тебе удобно.
      • Стоимость. По факту, носителей языка в России не то, чтобы много, поэтому и стоимость довольно высокая. По скайпу же преподаватель ведет урок из дома, из его страны.

      По ощущениям же, большой разницы нет — видео есть, звук есть — практически то же самое, как если бы сидел рядом.


  1. gaivan
    23.05.2016 11:06

    Забавно, что большинство комментариев про Skype, а не про машинное обучение. На мой взгляд, технологии использования виртуальной платформы при изучении английского языка намного быстрее помогают достичь нужного результата и оценить промежуточные итоги.