Обычно мои посты не предполагают высказывание своего невероятно важного мнения по горячим в моменте AI‑темам. Однако, здесь сдержаться оказалось тяжело. Я почти каждый день захожу в Твиттер — и примерно половина моей ленты связана с ML. Последние несколько недель желание сидеть там монотонно уменьшается — вместо интересных обсуждений всё заполнено твитами про AGI, AI alignment и про то, как скоро нашему миру белый пушистый зверек. Если вы хотите узнать ещё больше об организации процессов ML‑разработки, подписывайтесь на наш Телеграм‑канал Варим ML

Это реально так
Это реально так

Подобные споры идут в вялотекущем режиме постоянно, но точкой взрыва сейчас стали выход GPT-4 и открытое письмо, предлагающее остановить AI‑рисёч на полгода. На эту тему уже так или иначе высказались все большие ML‑специалисты, кто‑то (например, Ян Лекун и Франсуа Шолле) откровенно смеётся над волной истерии.

Другие, как Илья Суцкевер, выражают опасения по поводу потенциальной отдалённой угрозы. Но самые громкие голоса, конечно же — это откровенный хайп и шитпостинг от сумасшедших AI‑думистов.

Я уверен — вокруг темы AI можно и нужно дискутировать, этически спорных точек и без угрозы конца света предостаточно — социальные эффекты, угроза рабочим местам, авторское право, дипфейки, переосмысление концепции творчества, вопросы приватности и многое другое. Но текущая дискуссия точно не выглядит здоровой. Я прочитал и посмотрел несколько opinion pieces разной степени адекватности и решил поделиться с вами.

Илья Суцкевер и OpenAI

Достаточно интересное и абстрактное интервью от Ильи Суцкевера. Позицию он высказывает достаточно осторожно, в ней достаточно AI‑энтузиазма и футуризма, но и призывы к работе над мерами безопасности, конечно, звучат. Некоторые его мысли:

  • Сеть, просто предсказывающая следующий токен, вполне может быть умнее человека на разных задачах. Хорошее предсказание следующего токена — это не «статистический попугай», для этого нужно понимать реальность, которая привела к появлению этого токена.

  • AGI и AI alignment — размытые термины с разными возможными определениями. Но всё‑таки сейчас мы ещё не на уровне AGI, когда будем — сказать сложно.

  • Нужно стремиться к состоянию мира, в котором методы, ведущие к AI alignment, развиваются быстрее, чем способности самих моделей. На данный момент уровень нашего понимания того, как ведут себя большие модели, довольно низкий.

Небольшая ремарка от меня — AI alignment действительно максимально размытый термин, а его перевода на русский я так и не придумал. Примерно его можно понять так — это способность направить действия AI‑систем в русло, которое ожидает от них человек. Кажется, будет правильным сказать, что это подмножество области AI‑безопасности.

Аналогичный вайб и у поста OpenAI, в котором они концентрируются на понятных рисках — приватность, защита детей, меры безопасности от пользователей с не очень хорошими намерениями. Про экзистенциальные угрозы апокалипсиса тут ничего нет.

Ян Лекун

Вся позиция в одном твите
Вся позиция в одном твите

Лекун каждый день строчит по 5–10 твитов, порицающих сумасшедших AI‑думистов, и постоянно потешается над теми, кто думает, что LLM — это что‑то близкое к AGI. В Фейсбуке же иногда случаются и более глубокие дискуссии. Стюарт Расселл и другие возражают Лекуну и говорят, что стремление AI к контролю над миром может появиться и непреднамеренно, как следствие другой задачи или цели. Лекун же считает, что есть множество способов защитить себя от этих проблем при создании AI — например, изменить целевую функцию или добавить дополнительные механизмы защиты («safeguards»). Причём, для AI такие механизмы создавать намного легче, чем для людей. Поведение людей можно менять только опосредованно — через образование и законы, а в AI можно напрямую вложить ценности и правила при обучении — не убий, не укради, не возжелай AI ближнего своего.

Ну и ещё одная ключевая мысль от Лекуна, с которой, правда, согласны не все — пока мы даже не близко к созданию автономного умного AI, так что пока это всё дискуссии о «сексе ангелов». В общем, если хотите получить полное представление о всей палитре аргументов ML‑титанов, можно просто прочитать этот документ. А ссылка в подзаголовке ведёт на эвент, на котором Лекун и Эндрю, прости господи, Ын сегодня обсудят, почему шестимесячный бан на AI‑рисёч — это зло.

janus

Полезная классификация видов AI-систем
Полезная классификация видов AI-систем

Очень интересный LessWrong‑пост про то, что GPT‑модели лучше всего описываются термином «симулятор». Написан полгода назад, но имеет прямое отношение к сегодняшим дискуссиям.

GPT — не «агент». Интернет полон историй о том, как LLM‑модели пишут зловещие вещи о захвате мира, но это не значит что GPT «хочет» захватить мир. GPT генерирует текст, который симулирует поведение определённого агента или нескольких агентов. У этих агентов как будто бы есть определённые цели, задачи или желания, но так же легко модель может «создать» агента и с противоположными взглядами. GPT наплевать, какого агента симулировать, если его поведение укладывается в те самые «safeguards», заложенные OpenAI (которые, правда, пока легко обойти). И сетке наплевать, что вы закрываете вкладку в браузере и уничтожаете всех созданных ею агентов. Основная цель GPT при обучении и на инференсе — предсказание, и это позволяет модели симулировать агентов с любыми целями. Например, мы можем попросить давать иррациональные или неправильные ответы.

GPT — не «модель‑оракул» и не «модель‑инструмент». У GPT нет явной мотивации говорить только правду — наоборот, мы можем специально просить её лепить чепуху или пародировать какого‑нибудь дурачка. Метрики на классических QA‑датасетах и тестах вообще не очень хорошо отражают способности таких моделей, которые по факту намного шире.

GPT — не «мимикрирующая модель». GPT может имитировать поведение конкретного человека или нескольких людей, но её способности шире. Мы можем описать гипотетического человека, которого не было в трейн‑сете (например, самого мудрого человека на Земле), и GPT попробует предсказать его поведение за счёт общей способности предсказывать человеческий язык.

GPT — это «симулятор». При генерации текста GPT сэмплирует следующий токен из распределения вероятностей, добавляет его к текущей последовательности и затем генерирует следующий токен, таким образом симулируя будущее. С помощью этой способности предсказывать язык GPT может симулировать разные типы AI‑систем — агентов, оракулов, инструменты. При этом GPT не имеет способности сделать ничего реального — только симулировать реальный мир. В посте также разделяются концепции «симулятора» и «симулякра». GPT — это симулятор, которые может создавать разные симулякры. Такое разделение помогает ответить на расплывчатые вопросы про GPT — различает ли GPT корреляцию и каузацию, притворяется ли GPT глупее, чем есть, и так далее. Все эти вопросы имеют смысл в контексте симулякров, которые генерирует симулятор GPT.

В конце есть очень интересная ремарка — оказалось, что создание очень качественного симулятора реальности не требует создания AGI. GPT не нужно эмулировать работу мозга, чтоб создавать симулякры с очень неплохими по качеству виртуальными людьми.

Ajeya Cotra

Набор разных гипотетических предпосылок и сценариев, которые вертятся вокруг одной центральной темы — если мы продолжим скейлить модели, основанные на HFDT, то в конце концов они захватят мир. Мне такое чтиво кажется абсолютно безынтересным, уж лучше почитать дискуссию, которую я скидывал выше, в секции Лекуна. Но для демонстрации всего ландшафта решил включить.

Nathan Lambert

Многие ML‑специалисты и ML‑бизнесмены сейчас сильно нервничают. Кажется, что годы их рисёча и работы внезапно стали бесполезны, ведь теперь всё крутится вокруг ChatGPT. Хорошо сейчас в первую очередь ML‑инюфленсерам — можно каждый день выплёвывать тонны вирусного контента.

Автор, который работает в HuggingFace, рефлексирует по поводу этого чувства тревоги и даёт несколько простеньких общих советов как теперь жить — концентрироваться на науке, а не вирусности контента, не убиваться из‑за неудач. Добавлю, что ещё полезно помнить, что в AI на самом деле ещё очень много как научной работы, так и работы по внедрению в разные сферы. Так что у каждого есть способность привнести в мир что‑то новое.

Заключение

Я ни в коем случае не являюсь экспертом в областях LLM и AI safety. Но происходящее сейчас мне кажется достаточно безумным. Я полностью согласен с Лекуном, что называть ChatGPT предвестником AGI — это, мягко говоря, преждевременно. Наверное, можно понять людей не из индустрии, но когда на волну хайпа запрыгивают достаточно известные ML‑люди — мне это понять тяжело.

Всё это, конечно, отнюдь не значит, что развитие и распространение LLM и других ML‑систем не несёт никаких рисков. В принципе ничего нового — появление и развитие любой крутой технологии означает, что доступ к ней получают и не очень хорошие ребята, да и хорошие могут случайно натворить дел.

Что касается статей, то мой личный фаворит из сегодняшнего списка — пост про симуляторы и симулякры. Он выходит за рамки поднадоевшего спора «ChatGPT — это AGI» против «ChatGPT — это бездумный генератор токенов», и предлагает свежый взгляд на эту дихотомию. Рекомендую для любителей обсудить судьбы AI‑систем в барах и кальянных.

Если вы хотите узнать ещё больше об организации процессов ML‑разработки, подписывайтесь на наш Телеграм‑канал Варим ML.

Комментарии (11)


  1. Rainarrow
    18.04.2023 09:04
    -1

    Голос разума среди моря хайпа. Адепты секты свидетелей сингулярности не одобрят.


    1. crazysmith
      18.04.2023 09:04

      Воистину, словно глоток свежего воздуха среди тонн инфантильных текстов и бессмысленного инфошума, безумно алармистского или же преисполненного иррациональным благоговением.


    1. Hardcoin
      18.04.2023 09:04
      +1

      Но почему считать, что LLM далеко от AGI - это голос разума? С каких пор подход "это далеко не так круто, как кажется" стал разумным по умолчанию? LLM очень сильно переформатирует рынок интеллектуального труда - все свидетели секты "это просто предсказание токенов" окажутся там же, где сейчас свидетели сект "многоразовые ракеты не имеют смысла" и "электрические автомобили - бессмысленный хайп".


      1. crazyfrogspb1 Автор
        18.04.2023 09:04

        мне кажется, утверждения "LLM очень сильно переформатирует рынок интеллектуального труда" и "LLM далеко от AGI" вообще не противоречат друг другу


        1. Hardcoin
          18.04.2023 09:04

          Сами по себе - нет. Тем не менее, я считаю, что LLM близок к AGI. Доводы, что gpt-4 не обладает сознанием, мне кажутся слабыми. Интеллект - способность решать задачи. Как только gpt-5 сможет решать большинство задач лучше людей, интеллектуальный труд очень сильно обесценится. Это ещё какая проблема для миллионов людей, даже без захвата власти искусственным интеллектом.


          1. crazyfrogspb1 Автор
            18.04.2023 09:04

            ну в том числе об этом и мой пост, что есть риски намного более явные, чем скайнет. хотя я всё-таки не думаю, что в плане интеллектуального труда всё так плохо. перестраиваться - да, придётся. и в плане творчества, и в плане интеллектуального труда. через какое-то время - и физического тоже


  1. Sadler
    18.04.2023 09:04
    +3

    Ну, типичный твиттер, ничего нового. Большинство строит свои фантазии на фантастических фильмах и литературе, в этом и проблема. С другой стороны, я бы не стал рассматривать мнение Лекуна как истину в последней инстанции. Понятие AGI, к сожалению, лежит в плоскости философии, а не науки, у нас банально недостаточно критериев для определения, близко или далеко мы от AGI, поэтому ёрничать относительно "генераторов токенов" в таком случае не имеет смысла.С тем же успехом он мог бы заявить, что на современных вычислителях вообще никакой AI невозможен, т.к. это просто гора матричных вычислений, ничего больше. AGI -- это высокоуровневая модель, и мы не знаем, на каких низких уровнях она может быть реализована.

    Я не адепт сингулярности, развитие индустрии может пойти сильно по-разному. Пока точно есть неплохой запас по экстенсивному пути развития: улучшение наборов данных, увеличение мощностей для обучения. Относительно интенсивного пути время покажет.


    1. crazyfrogspb1 Автор
      18.04.2023 09:04
      +1

      да, меня его писанина часто раздражает, особенно учитывая, что среди неё встречаются и реально интересные мысли.

      в остальном тоже согласен, хотя мне лично, конечно, ближе и милее подход, что к мифическому "настоящему AGI" мы приблизимся архитектурным, а не брутфорсным путём. но тут да, ещё сильно зависит от выбранного определения AGI


      1. SozTr
        18.04.2023 09:04

        Для определённого типа задач, решение возможно достичь "полубрутфорсным" методом, по типу AlphaGo.


  1. leventov
    18.04.2023 09:04

    Вот очень хороший обзор текущего дискурса: https://ai.objectives.institute/blog/mapping-the-discourse-on-ai-safety-amp-ethics. Сильно полнее вашего поста.


    1. crazyfrogspb1 Автор
      18.04.2023 09:04

      спасибо за ссылку)