С тех пор как летом 1956 года на Дартмутском семинаре придумали термин «искусственный интеллект», эта техническая область развивалась на удивление неравномерно. С одной стороны, с ИИ связаны сотни захватывающих дух заголовков. С другой стороны, — такое сильное разочарование, что командам ИИ приходилось скрывать свою суть под другим именем, лишь бы стереть клеймо несбыточных обещаний и мизерных результатов.
Команда VK Cloud перевела статью о том, что на самом деле сейчас происходит с искусственным интеллектом: чего от него ждут, сколько он стоит и как будет развиваться в будущем.
Общая картина
По мере прогресса в сфере ИИ стали появляться и настоящие прорывы. Но инновации, как правило, ограничивались чисто техническими направлениями, — например, играми, в которых ИИ действовал по строго заданным правилам. За редкими исключениями типа участия суперкомпьютера Watson в «Своей игре» успехи искусственного интеллекта сводились к высокой эффективности приборов в узкоспециализированной деятельности.
Но вот уже несколько лет ходят слухи, что в крупных, обладающих значительными ресурсами ИТ-компаниях команды высокопрофессиональных инженеров в области ИИ ведут секретную работу. Конечно, из-за долгой череды подъемов и спадов в истории развития искусственного интеллекта на эти разговоры часто не обращали внимания. Но при всем при этом молва время от времени выносила на поверхность новости, от которых удивленно приподнимали брови даже самые отъявленные скептики. Например, интерфейсы компьютеров отлично справлялись с тестом Тьюринга — может быть, в конечном счете именно это подстегнуло появление Регистра Тьюринга у Гибсона. В определенной степени догадками о работе по развитию ИИ объясняется необъяснимое в ином случае участие в этих проектах множества специалистов по этике. В том числе и тех, кого потом просто игнорировали или увольняли. Или все это одновременно.
В целом игнорирование социальных последствий в широком смысле весьма типично для ИТ-отрасли. Именно в этих условиях решения на основе больших языковых моделей стали появляться как грибы после дождя. Первые признаки возможного прорыва в развитии ИИ стали заметны где-то в 2021 году. К работам по созданию больших языковых моделей приступили за три года до этого. Нейросеть DALL-E, способная генерировать цифровые изображения по текстовым описаниям, дебютировала в январе 2021-го. Copilot, система автодополнения кода, появилась на GitHub полгода спустя. Еще через год, с разрывом в месяц, вышли приложения на основе генеративного ИИ Midjourney и Stable Diffusion.
Но именно ChatGPT, релиз которой пришелся на ноябрь прошлого года, свела всех с ума. С тех пор и ИТ-индустрия, и весь мир вместе с ней задаются вопросом: что сейчас происходит?
При всем уважении к ChatGPT и ее ИИ-соратникам, которые наверняка в мгновение ока уверенно ответили бы на этот вопрос, мы пока что не нашли правильный ответ. Однако, чтобы оценить возможности и опасности, таящиеся в искусственном интеллекте, имеет смысл посмотреть на нынешнее поколение ИИ-решений через призму не столь глобальных вопросов. Вот десять направлений, по которым возникают вопросы. Хотя, конечно, это далеко не полный список тем, которые стоит исследовать.
Ставки
За девять дней до выпуска ChatGPT основатель open source-проекта задался вопросами: неужели наконец настал звездный час ИИ? мы на пороге глобальной революции в отрасли? Ответ на оба вопроса положительный. По некоторым оценкам, за всю историю ИТ ни у одного приложения количество пользователей не росло так быстро, как у ChatGPT. Это не случайность.
ИИ предыдущего поколения представлял собой слегка замаскированную линейную регрессию или узкоспециализированные решения, предназначенные для конкретных сценариев использования. Все это никак не касалось обычных пользователей, за очевидным исключением Alexa, Google Assistant и Siri. В отличие от них, модели на основе LLM невероятно универсальны. Да, это еще несовершенные решения. Но их уже можно было использовать каждый день, причем настолько, что офисные сотрудники, будь то дизайнеры, разработчики приложений, маркетологи или даже генеральные менеджеры бейсбольных команд, начали переживать, не останутся ли они без работы. К этому вопросу мы еще вернемся.
Прошло пять месяцев, и практически каждая технологическая компания, попавшая в поле зрения RedMonk, использует ИИ. Десять лет назад таким ураганом пронеслись по отрасли контейнеры в целом и Docker в частности. Буквально в два счета они проделали путь от любопытной технологической новинки до стандартного компонента корпоративной системы ценностей каждой компании. И неважно, действительно ли контейнеры нужны были для этого, — все крутилось вокруг Docker. Мы в RedMonk еще никогда не видели, чтобы технология распространялась так быстро. Но сейчас кажется, что по сравнению с темпами распространения ИИ внедрение контейнеров было весьма неспешным.
Причин для этого много, но самая очевидная — непревзойденная универсальность искусственного интеллекта: на данный момент в мире очень мало задач, для которых ИИ принципиально не приспособлен или с которыми не может справиться. А это значит, что для всех нас ставки высоки как никогда.
Затраты
Месяц назад руководитель одной ИИ-команды рассказал о том, что после выхода ChatGPT у них резко изменилось отношение к финансированию. Раньше им приходилось практически выпрашивать, занимать и красть, чтобы заполучить нужные GPU. А после релиза ChatGPT руководство буквально завалило их деньгами, лишь бы ускорить работу. К этому моменту проблема нехватки денег сменилась дефицитом GPU. Спрос на GPU взлетел до небес. Это предсказуемо повлияло на стоимость оборудования и трудности его приобретения. «Нам не хватает GPU» стало бесконечным рефреном в отрасли. От экономических проблем, связанных с эксплуатацией крупномасштабной ИИ-инфраструктуры, не застрахованы и те немногие компании, которые способны самостоятельно производить процессоры. У нас нет достоверных данных о том, насколько запросы к разговорному ИИ дороже традиционного поиска в интернете. И все же все согласны, что это существенно дороже, предположительно раз в десять.
Цена создания и эксплуатации таких крупномасштабных сервисов имеет свои последствия и для потребителей, и для поставщиков. В отсутствие финансирования из других источников (то есть от рекламы) потребители могут столкнуться с резким переходом от бесплатных к платным услугам буквально через несколько месяцев. Что окажется большим неудобством для тех, кто не может позволить себе за это платить. В то же время большинство поставщиков программного обеспечения, скорее всего, не сможет самостоятельно разработать конкурирующие технологии, а потому все сильнее будет зависеть от крупных платформ. К этому вопросу мы тоже еще вернемся.
При всех перспективах ИИ кажется очевидным, что на стоимость технологии и связанные с ней последствия сейчас обращают недостаточно внимания.
Деньги
Много лет назад, когда первая итерация Docker находилась в зените отраслевой славы, компания Lumen, тогда еще CenturyLink, выпустила проект под названием Panamax. Суть его сводилась к управлению контейнерами, как и у Kubernetes. В появлении одного из таких проектов не было ничего необычного. Необычным было то, что в Docker неоднократно благословляли этот проект CenturyLink.
Это было неожиданно: казалось, в Docker не видели или не желали воспользоваться прибылью, которую сулило управление контейнерами. История аналогичных рынков, таких как рынок решений виртуализации, показывает, что деньги приносит не само технологическое основание, а управление им. Так что на тот момент у Docker было любопытное отношение к происходящему. Впрочем, дело все равно закончилось ничем: Kubernetes в конечном счете смела конкурентов.
Как и в эпоху появления контейнеров, так и сейчас, в эру искусственного интеллекта, принципиальным остается вопрос, откуда берутся деньги. Но в случае с контейнерами у нас были модели генерирования прибыли, которые можно было принять за образец. А в случае с ИИ таких моделей нет.
На данный момент компании изо всех сил пытаются определить модели ценообразования и получения прибыли для потребителей и организаций. Кто, кому и за что платит? Очевидно, у владельцев, операторов и создателей LLM-моделей есть ИТ-продукты, которые пользуются большим спросом, и, как следствие, возможность активно извлекать прибыль. В этом плане OpenAI очень показательный пример. А как насчет тех, кто хотел бы получить доступ к этим моделям? Какой вид примут модели ценообразования? Как они будут меняться в будущем, по мере того как ИТ-решения будут все сильнее зависеть от функций LLM? Это непростые вопросы. И мало того, все еще дополнительно усложняется вопросами о доступе к данным, правах собственности и стремлении защититься от конкуренции.
Контроль
Небольшие фирмы, сотрудничающие с поставщиками ИИ, чтобы получить доступ к функциям LLM, будь то разговорный искусственный интеллект или другие решения, испытывают экзистенциальный страх, что такое партнерство может оказаться сделкой с дьяволом. С этой точки зрения ситуация напоминает невыгодный обмен, когда краткосрочный выигрыш в функциональных возможностях сменяется нерелевантностью в долгосрочной перспективе, поскольку из-за данных, которые небольшая компания передает крупной ИИ-платформе, первая в конечном итоге утрачивает былую значимость.
Из этого тезиса можно сделать вывод, что, просто накопив достаточно данных, одна компания сможет завладеть практически любым рынком. С одной стороны, этот логический вывод кажется невероятным. На практике чем сильнее компания распыляется, тем ниже ее компетентность и конкурентоспособность на отдельно взятом рынке. Добавьте к этому еще и естественное отвращение организаций к работе с виртуальными монополиями.
Но, с другой стороны, долгая история платформ убедительно демонстрирует, что если вы запускаете приложение или сервис поверх чужой платформы, и это приложение или сервис становится достаточно популярным, сторонняя платформа попытается скопировать или поглотить ваше решение. Хотя бы потому, что этого требуют пользователи родительской платформы.
Следовательно, ключевым вопросом для развития совместных ИИ-проектов остается контроль, владение данными и их защита — что, похоже, в своих предложениях признает и AWS. Это не только проблема провайдеров. Скорее всего, этот вопрос останется главным, потому что он важен для каждого. И в каком-то смысле ситуация уникальная. Отдельные пользователи, работающие с инструментами генеративного ИИ, все чаще задумываются, не предоставляют ли они тем самым средства для обучения искусственного интеллекта, который потом их же и заменит? Как говорится, «если у тебя паранойя, это еще не значит, что за тобой не следят».
Доверие
Помимо проблемы доверия между разными участниками экосистемы, перед ИИ-решениями — по крайней мере решениями со сложными результатами, которые нельзя мгновенно разобрать на составные части, как код или текст, — встает еще один принципиальный вопрос: можно ли доверять самому искусственному интеллекту.
Объявление о выходе Copilot вызвало скепсис. Вот как это комментировали:
Даже от разработчиков, которых не мучают нравственные терзания по поводу этого сервиса, можно увидеть комментарии вроде: «Да, интересно, но я не заплачу им столько, сколько готов платить Netflix». Что вполне обоснованно, если вы вообще не доверяете продукту. Но совершенно бессмысленно, если вы доверяете продукту: $10 — весьма скромное вознаграждение за систему автодополнения кода, доступную в любой момент. Вполне вероятно, что первоначальный ажиотаж частично спадет, так что в конечном счете у проекта, обладающего таким потенциалом преобразования жизни, результаты будут скромнее, чем ожидалось.
Дефицит доверия к генеративным системам никуда не исчез. Даже при самом оптимистичном сценарии они подвержены базовым, фундаментальным фактическим ошибкам. А худшие сценарии — компьютеры, которые идут по пути HAL 9000 или Скайнет, — уже больше не кажутся столь неправдоподобными.
Хорошая новость для поставщиков решений: темпы использования этих систем все равно растут, несмотря на ошибки, отчасти потому, что при выполнении базовых задач, таких как генерирование необходимого веб-каркаса, вероятность и критичность таких ошибок не столь велики. Кроме того, с этими системами работает все больше пользователей, потому что им кажется, что у них просто нет выбора. Многие спортсмены против воли подсаживаются на допинг из страха уступить соперникам. Так и искусственный интеллект воспринимается теперь как необходимый инструмент для множества сценариев, от учебы до работы.
Плохая новость состоит в том, что недоверие сохраняется. И неясно, с какой стороны его восстанавливать: со стороны систем или их пользователей. Хотя польза, которую приносят эти системы, гарантирует их дальнейшее использование, завоевать доверие пользователей будет трудно.
Юридические вопросы
Доверие к генеративному ИИ — это сложный вопрос, но куда сложнее правовая неопределенность, связанная с этими платформами. С концепцией генеративного ИИ в целом связано множество проблем права, а некоторые из первых решений так и не прояснили ситуацию.
Есть еще проблемы с разными лицензиями, от open source и простых до проприетарных. Далее проблемы с неявными зависимостями в отношении закрытых или не до конца открытых ресурсов. А еще — проблема определения, кто, собственно, находится под угрозой в юридическом смысле слова: поставщики, пользователи систем? Это кажется маловероятным, но, как нам постоянно напоминают в традиционном мире open source-решений, достаточно всего одной слишком агрессивной и склонной к сутяжничеству стороны, чтобы испортить ситуацию на том или ином рынке.
Учитывая все эти проблемы, о правовой стороне генеративного ИИ с уверенностью можно сказать только одно: здесь никто ничего не понимает. Ставки высоки. Ситуация меняется каждый день, а судебные системы неспешно рассматривают правовые споры исключительной важности. Поэтому, как указано здесь, некоторые компании будут скорее просить прощение, нежели разрешение.
Абстракция
Как сказал Грейди Буч, «вся история развития программирования — это история повышения уровня абстракции». Пожалуй, в последнее время эта тенденция наиболее заметна в попытках разработчиков разобраться в постоянно расширяющемся каталоге так называемых облачных примитивов.
По-видимому, искусственный интеллект, в частности разговорный, способен достичь чрезвычайно высокого уровня абстракции. Если модели LLM могут генерировать исходный код, то что мешает им управлять инфраструктурой? Или выполнять аналитические запросы, или запросы к базам данных? И так далее.
Так что сейчас в ИТ встает вопрос не о том, может ли генеративный ИИ служить абстракцией для разных примитивов, а каков надлежащий уровень абстракции? Сколько ему нужно конкретики и руководящих указаний? Что можно оставить на усмотрение искусственного интеллекта, а что должно оставаться только в руках человека?
Вполне ожидаемо, сейчас рынок агрессивно экспериментирует с ответом на этот вопрос. Пока, как и на многие другие вопросы в этой сфере, у специалистов нет единого ответа. Вероятно, следующий уровень абстракции — или по крайней мере один из них — будет состоять из посредников искусственного интеллекта.
Профессии
По проблеме профессий в эпоху искусственного интеллекта также существуют разные точки зрения. Все согласны, что ИИ может беспрецедентным образом повлиять на работу в офисе. Одна группа специалистов напоминает, что из-за изобретения компьютеров или электронных таблиц офисы не опустели, а банкоматы не вытеснили из банков кассиров, о чем подробно рассказал д-р Джеймс Бессен. Как кто-то написал в Twitter, масса людей наблюдают парадокс Джевонса в реальном времени.
Но есть и группа специалистов, которая смотрит на вещи менее оптимистично, хотя в большей степени по соображениям общественного блага:
В ближайшие годы рынок труда ожидают чрезвычайные, почти беспрецедентные потрясения. В правый верхний квадрант попадут разработчики, специалисты по налогам, сотрудники колл-центров и т. п. Миллионы разных специалистов потеряют работу, и произойдет это быстрее, чем в предыдущие периоды автоматизации. Это приведет к разнообразным последствиям для секторов экономики, налоговых поступлений и даже для стабильности общества в регионах и странах, в значительной степени зависящих от профессий, представители которых пострадают сильнее остальных. Такое обширное и в принципе дестабилизирующее влияние нельзя недооценивать, это очень важный момент.
Кажется, что заменить человека машиной — даже если допустить, что они выполняют одну и ту же работу — проще на бумаге, чем в жизни, ведь такой подход практически не учитывает ценность взаимодействия, возникающую за пределами самой работы. И все же нет никаких сомнений в том, что перемены грядут, и мы увидим их очень скоро. Человечеству не привыкать к переменам и кризисам; но раньше они не происходили так стремительно, как события последних двух лет.
В свое время работники заводов, ферм и других производств, пережив промышленную революцию, направляли своих детей в безопасную офисную гавань — казалось, работе в офисе ничего не угрожало. Сейчас уже непонятно, какие профессии уцелеют после автоматизации с помощью искусственного интеллекта. У разработчиков есть реальная возможность сохранить главенствующие позиции, оставаться пигмалионами нашего времени, как это видит мой коллега. Но и их риски вполне реальны.
Будет ли генеративный ИИ дополнять человека или заменит его — это в долгосрочной перспективе один из принципиальных вопросов для всего общества. Он касается разработчиков и многих других профессий, использующих компьютер в работе.
Панорама
Вот уже более десяти лет отрасль размышляет о том, как лучше конкурировать с AWS. Компания доминирует на важнейшем рынке ИТ и не проявляет никаких признаков замедления темпов развития. А руководители конкурирующих компаний задаются вопросом, как свергнуть ее с трона и возможно ли это в принципе. Пока что никто не нашел ответ, но за многие годы отрасль впервые столкнулась с ситуацией, когда AWS немного потеснили с пьедестала. Как и ожидалось, подвинуть компанию удалось не на основных рынках, а совершенно в другой области. Никто не надеялся одержать победу над AWS, обойдя ее в облачных ресурсах для высокопроизводительных вычислений или скорости сервиса управляемых баз данных. Вместо этого компанию обошли с наименее защищенного фланга, выставив против нее модель, которой ей нечего было противопоставить — что поразительно, учитывая размер и масштабы портфеля продуктов. Наконец, две недели назад компания ответила, предложив разработчикам набор примитивов в форме hosted-моделей и облачных ресурсов для высокопроизводительных вычислений. Ответ вполне в стиле AWS, отличающий ее от конкурентов. Она позиционирует себя как нейтральную площадку для компаний, обеспокоенных прежде всего усилением Microsoft, собирающей большие объемы данных. Ирония судьбы, если учесть, что конкуренты AWS подогревают страхи об укреплении Amazon в разных отраслях, в основном в ритейле.
Довольно непривычно видеть AWS скорее в оборонительной, нежели в проактивной позиции. Не менее удивительно, что в таком положении оказалась и Google, учитывая историю и репутацию компании в области искусственного интеллекта. В конце концов, именно она изобрела основу LLM, которые сегодня используют для конкуренции с этой компанией. Нежелание Google перенять модели LLM проще понять через призму дилеммы инноватора. Учитывая долю доходов, которую поиск приносит компании, технология, не всегда способная улучшить результаты поиска, но при этом стоящая в десять раз дороже за запрос, будет восприниматься в лучшем случае как неоднозначное благо. Добавьте к этому некоторые обоснованные этические соображения, и вот Google тоже оказалась в проигрыше. В результате рыночная капитализация компании упала на 6% из-за явно поспешной и слегка неудачной реакции общественности. А Microsoft, чьи боты вели себя как буйнопомешанные, прибавила 5%. И это при том, что, по крайней мере, по некоторым данным, последняя итерация движка Bard от Google превосходит новейшую разработку Microsoft и OpenAI по эффективности задач кодирования. Похоже, в этих обстоятельства у Google просто не оставалось выбора. Какое-то время назад компания разработала технологии типа ChatGPT, но не обнародовала их ввиду высокой стоимости и понимания, что они еще не полностью готовы к релизу. Потом появился совместный проект OpenAI и Microsoft, так что Пичаи Сундарараджану и исполнительному руководству Google оставалось только последовать за ними. Сейчас вопрос не столько в самих технологиях, сколько в том, сможет ли Google построить бизнес на основе этих технологий так же быстро, как Microsoft и OpenAI, и противопоставить что-нибудь преимуществам этих двух первопроходцев.
Это, в свою очередь, возвращает нас к Microsoft. Похоже, что Наделла и Ко вовремя заметили возможность взобраться на оптимальную высоту для следующего прорыва в отрасли. Поведение компании явно свидетельствовало о том, что дело срочное. Ее решения во многом впечатляют, и все же на момент релиза было очевидно, что они еще сыроваты. Тем временем увольнение команды по этике и общественным вопросам стало своего рода сигналом. Благодаря большой доле в OpenAI и активам GitHub как в плане разработки продуктов, так и огромного массива данных у Microsoft относительно сильное положение для движения вперед. Компания стояла бы на ногах еще крепче, если бы некоторые вопросы брендов и вывода продуктов на рынок совместно с GitHub были решены в пользу последнего. Но сейчас Microsoft обладает широкими возможностями в области искусственного интеллекта и несравненными объемами кода, а еще оказывает всестороннее влияние на разработчиков и офисных работников через пакеты продуктов GitHub и Microsoft соответственно.
Иными словами, великая гонка искусственного интеллекта началась. Остается дождаться и посмотреть, как экосистемы выстроятся вокруг крупных игроков.
Результаты
Во времена промышленной революции многие, если не все, новые технологии появлялись под бурные рукоплескания и причитания о скорой неминуемой гибели. Например, несколько лет назад Джей Розен в интервью рассказал о неприятии телефона в викторианскую эпоху: люди боялись что телефон полностью уничтожит процесс ухаживания. Что, впрочем, и произошло, просто общество научилось с этим мириться.
Примечательно здесь то, что обычно погибель пророчат не сами создатели новых технологий. Но сейчас мы имеем дело именно с этим необычным феноменом: многие из тех, кто приложил руку к созданию этих технологий, высказываются против них, кто в открытых письмах, кто в статьях.
Чтобы утешить себя любимого, так и хочется заглянуть в Архив пессимиста и посмеяться над глуповатыми страхами по поводу новых технологий. Но когда даже условные оптимисты предупреждают о надвигающейся беспрецедентной безработице, трудно сохранять спокойствие.
Ящик Пандоры уже открыт. Нам остается только пытаться направлять развитие появившихся технологий по пути, на котором они дополняли бы существование среднестатистического человека, а не лишали его смысла.
Построить собственную систему машинного обучения поможет Cloud ML Platform от VK Cloud — платформа для полного цикла ML-разработки и совместной работы Data-команд. Новым пользователям для тестирования мы начисляем 3000 бонусных рублей.
Stay tuned
Присоединяйтесь к телеграм-каналу «Данные на стероидах». В нем вы найдете все об инструментах и подходах к извлечению максимальной пользы из работы с данными: регулярные дайджесты, полезные статьи, а также анонсы конференций и вебинаров.
chukotsky
Сразу вспомнился «Черный Ящик» Андрея Родионова и Бориса Тихомирова:
Черный Ящик