Пока ChatGPT ставит рекорды по количеству пользователей, а Microsoft и Opera внедряют в свои продукты технологии на его основе, управляющий партнёр rdl by red_mad_robot Юра Чайников рассуждает об искусственном интеллекте, нейросетях и стремительно меняющемся процессе мышления.


Про грани мышления

Футуролог Артур Кларк утверждал, что любая достаточно развитая технология неотличима от магии. Я вижу, как тезис Кларка всё ярче проявляется во всё больших областях человеческой интеллектуальной деятельности.

Понимать, осознавать, мыслить, рассуждать, думать, делать выводы, удерживать контекст, изобретать небывалое, передавать смысл, пересказывать, общаться, рисовать по описанию, учиться новому, целенаправленно лгать — мы различаем массу терминов, которые сильно отличаются в понимании мышления, рассуждения и рефлексии. Для нас это совершенно разные слова. Но для подавляющего большинства людей это всё свойства, грани обобщённого интеллекта, который для них является привычным инструментом проживания жизни. И границы этих слов довольно сильно размыты.

Про комнату Сёрля

Американский философ Джон Сёрл в 1980 году опубликовал в журнале Behavioral and Brain Sciences статью под названием «Minds, Brains, and Programs», в которой описал мысленный эксперимент, известный как «китайская комната».

Представим изолированную комнату, в которой находится человек, не знающий ни одного китайского иероглифа. Но у него есть точная инструкция по взаимодействию с ними по типу «возьмите такой-то иероглиф из первой коробки и положите его рядом с таким-то иероглифом из второй коробки». В этой инструкции нет информации о значении этих иероглифов — человек просто следует ей подобно компьютеру.

Наблюдатель, знающий китайскую письменность, через щель передаёт в комнату иероглифы с вопросами, ожидая получить на выходе осмысленный, разумный ответ. А инструкция составлена так, что после применения всех шагов к иероглифам вопроса они преобразуются в иероглифы ответа. Фактически инструкция — это подобие компьютерного алгоритма, а человек исполняет алгоритм так же, как его исполнил бы компьютер.

В такой ситуации наблюдатель может отправить в комнату любой осмысленный вопрос и получить на него осмысленный ответ — прямо как при разговоре с человеком, который свободно владеет китайской письменностью. При этом человек внутри комнаты ничего не знает об иероглифах и не может научиться ими пользоваться, так как не может узнать значение даже одного символа. Человек не понимает ни изначального вопроса, ни своего ответа. А наблюдатель может быть уверен, что в комнате находится человек, который знает и понимает иероглифы.

Если мы выкинем из этого рассуждения человека, а оставим алгоритм, то возникает очень философский вопрос — понимает ли алгоритм, думает ли он, мыслит ли, делает ли выводы?

Про ChatGPT и другие нейросети

В попытке определить разумность люди многократно называли свойствами ума навыки, которые пока не технологизированы. Многое из того, что раньше считалось признаками безусловного интеллекта и мышления человека, сейчас делается программами лучше человека или на границе этого «лучше/хуже»:

  • трансформация речи в текст и наоборот,

  • распознавание лиц, предметов,

  • игра в шахматы, го и покер,

  • любая игра без объяснения правил,

  • общение голосом (Siri, Алиса),

  • генерация музыки, видео и изображений по текстовому описанию с сохранением стиля,

  • смена стиля, частей тела, цвета волос по текстовому запросу,

  • деобфускация программного кода,

  • решение задач из ЕГЭ на 50 баллов,

  • сдача выпускного экзамена МВА на четверку.

Некоторые из этих вещей для нас сейчас самоочевидны — «компьютеры всегда так умели», что же в этом разумного? А некоторые утверждают, что «никогда распознавание образов и не было признаком разума».

Нейросеть ChatGPT поддерживает диалоги на естественном языке. В ряде вопросов она выглядит как болтливый пятиклассник с университетскими знаниями — и может довольно долго поддерживать человеческое общение. Я проверял, как она себя ведёт, и обнаружил, что из стандартных задач на алгебру и статистику из ЕГЭ я способен заставить её решить заметную часть задач, просто формулируя запрос по типу «представь, что ты математик, реши задачу».

И это то удивительное, что происходит с нами прямо сейчас. А первые восемь пунктов из списка выше мы уже воспринимаем как обычное явление. И мы перестаём считать это признаком ума или частью мышления. Получается, что у человека остается всё меньше того, что он делает лучше, чем машина.

Про то, что машина может делать лучше, чем человек

Что машина может делать лучше, чем человек? Или что она может делать достаточно, чтобы в какой-то области заменять человека?

Возьмём медицину. Может, анализ рентгеновских и КТ-снимков машина делает и не лучше, чем первоклассные специалисты, но она уже делает это лучше, чем средний врач в средней больнице. Контроль совместимости лекарств при сложных комплексных лечениях она точно делает лучше человека. У неё драматически меньше случаев применения несовместимостей, которые приводят к осложнениям или смерти. Это в целом плохо даётся обычному человеку или, если быть точнее, очень дорого даётся — человек должен очень многое перепроверять вручную. Это было по силам доктору Хаусу, но это не по силам обычному человеку. И машина это умеет делать лучше, чем мы.

ИИ принимает решения, наблюдает за реальностью и делает выводы о ней. Как только мы сужаем задачу до чего-то очень конкретного, часто выясняется, что современные технологии глубоких нейронных сетей уже доросли до того, чтобы делать кусок задачи лучше, чем человек.

Про риски

Что мы, как деятели, можем сделать с этой ситуацией? Занимая какую-то роль, нам нужно стремиться наблюдать за тем, как устроены текущие перспективные технологии на основе ИИ в наших предметных областях.

Дизайнеру нужно знать про stable diffusion. Автору текстов — про ChatGPT. Эффективному менеджеру — про нейрокомпьютерные интерфейсы с расшифровкой речи. Медику — про инструменты предотвращения несовместимости лекарств на основе ИИ. Биохимику — про подходы к проектированию веществ на основе ИИ. Урбанисту-проектировщику — про техники управления светофорной сетью, рекомендации ИИ о выборе мест для открытия ТЦ и т. д.

Некоторые из этих примеров возникли за последние несколько месяцев. Часть из них вызывает у меня страх. По мере того как эти штуки умнеют, всё лучше умеют удерживать контекст, решать конкретные задачи — и делать это на естественном человеческом языке, — это становится инструментом сильнее атомной бомбы.

Если у человека в руках оказалась технология, которая за десять центов за сообщение способна индивидуальным образом вести диалоги с сотней миллионов людей, убеждая их, например, голосовать за определённого кандидата, то у него возникнет очень большой соблазн использовать её именно таким образом. А если их, таких акторов, много, то мы рискуем довольно быстро оказаться в ситуации, когда средний человек будет сходить с ума от того, что несколько конкурирующих систем интенсивно полощут ему мозги, потому что расшатанную психику легче склонить к тому или иному действию с большей спонтанностью.

Да, люди бывают слабы, жадны, глупы. Но думать, что искусственные штуки будут в этом смысле более совершенны, чем мы, кажется мне неоправданным оптимизмом. Во-первых, когда мы их учим, они учатся нашим же грехам. Во-вторых, когда мы начинаем их применять по своей воле, они становятся огромным усилителем того, что было намного труднее сделать раньше, — например, манипулировать общественным мнением и сознанием. В таких масштабах раньше этого не бывало.

Про то, куда это всё идёт

Мышление — это уже не сугубо человеческий навык, а сложный «кентаврический» навык совместных человеко-машинных систем.

В нашей современной экономике очень много деятельности, связанной с оперированием физическими предметами, она завязана на примитивной логистике. Человек забрал один предмет, переставил его в ящик, запаковал ящик, поставил его на ленту, лента поехала дальше, с ленты его погрузили в автомобиль, из автомобиля вынули и понесли на склад. Совокупная доля таких человеческих операций, по разным оценкам, от 20 до 80% — в зависимости от отрасли и конечного товара. И это невозможно поручить этим штукам, потому что они пока не слишком умные. Ключевое слово — «пока».

Темп прогресса глубоких нейронных сетей, больших языковых моделей и методов обработки изображений в области «понимания» впечатляющий. Буквально два года назад я и помыслить себе не мог, что смогу разговаривать с ChatGPT человеческим языком и она будет отвечать на вопросы, попадая в контекст.

Текстовые модели и нейронные сети «смотрят» на нашу физическую реальность и «понимают», в каких обстоятельствах этой реальности они находятся. Они стремительно прогрессируют в направлении того, что с каждым днём им можно будет поручать ещё один очередной кусок деятельности. И когда они начнут понимать фразы по типу «Приготовь мне кофе, принеси тапочки» или «Оформи выкладку молочных продуктов в отделе № 7», огромное количество областей умрёт как сфера человеческой деятельности.

Мы думали, что роботы заменят нас в простых человеческих действиях, но самый стремительный прогресс сейчас наблюдается в творческих областях. Например, в Amazon успешно продаются около 200 книг, написанных совместно ChatGPT и человеком. Я сдавал экзамен по английскому языку в аспирантуре в МАИ с помощью этой штуки. Она работает вместе со мной эффективнее, чем я один.

В общем, мир невероятно изменится в связи с этим. И что такое мышление, где проходят границы терминов о том, как мы мыслим, — это большой вопрос. Мы можем оцифровывать большое количество человеческих текстов, видео и речи и внутри этой оцифрованной сущности будет возникать всё более аутентичная личность, модель персонажа — и да, с ней можно будет поговорить как с почти живым человеком.

Мы не просто на пороге новой промышленной революции в этом направлении. Мы уже внутри неё.


Кстати, у нас открыта вакансия Data Scientist.

Над материалом работали:

  • текст — Юра Чайников,

  • редактура — Виталик Балашов,

  • иллюстрации — Марина Черникова.

Делимся железной экспертизой от практик в нашем телеграм-канале red_mad_dev. А полезные видео складываем на одноимённом YouTube-канале. Присоединяйся!

Комментарии (2)


  1. DJP
    00.00.0000 00:00
    +1

    А человеку останется (а что ещё-то?) продолжать оставаться человеком, а не коленопреклонённым верующим в магию технологий последователем карго-культа и членом секты свидетелей ChatGPT.
    Для этого, в частности, например, не плохо бы понять и определить что есть ум, что разум, что мышление, что интеллект, что сознание...
    А так же, опять же в частности, по вашим материалам, не слепо верить авторитету Дж.Сёрла, "китайская комната" которого лишь на первый взгляд вполне убедительна, а включить собственный разум и поместить этот эксперимент в реальность... где внезапно выясниться, что во-первых вопросы-то могут быть многозначными и даже с ошибками т.е. те, ответы на которые не могут быть учтены книгой переводов. А во-вторых, как мы знаем, со временем меняется и язык, появляются новые понятия, а старые уходят или их смысл меняется... что непременно приводит к неадекватности такого "слепого перевода"... и нужно и из комнаты выглядывать, и книгу-то корректировать... А лучше самому выучить китайский язык...


  1. aughing
    00.00.0000 00:00

    Лет 100 с лишком назад, один бородатый чудила написал: "Жизнь - есть способ существования белковых тел.". Так себе определение, типа китайских мирных инициатив. Но в принципе, никто и не возражает. Сегодня
    "все" понимают, что жизнь это безумно сложная, но все-таки химия, и сроку ей никак не меньше 3 миллиардов лет.

    Сотни миллионов лет биологические нейронные сети тренировались различать, определять, прыгать, бегать и т.п., а цена ошибки - "съел и порядок.". В GPT3/4, по заявлениям, полтора миллиарда параметров.
    А сколько там параметров в сетке из сотни миллиардов нейронов? Такая штука выдала теорему о неполноте, уравнения Шредингера и Эйнштейна, и кучу текстов от Гомера и Лао Цзы до мерзкой кляузы на ученицу
    в классе от училки. Но в принципе, за сотни миллионов лет, непонятное число живых нейронных сеток похоже чему-то научились, раз живы до сих пор. И каждую новую все равно приходится доучивать генерировать
    следующее слово (в основном получается так себе).

    Tак что, с не меньшим апломбом могу заявить: "Ум, разум, мышление и т.д. и т.п. - есть способ существования нейронных сетей.". А поводом для апломба, конечно, является вот это "малёхонькое" достижение - GPT3, что
    само по себе совершенно удивительный факт.

    "Но есть один нюанс", если правда оно, ну хотябы на треть, то куда девается свет, когда его выключают?