Может ли искусственный интеллект прогнать нас от компьютеров и отправить работать на завод? Большие языковые модели действительно меняют интеллектуальные профессии: взамен старых приходят новые, более разнообразные. И начинают появляться люди, которых я называю погонщиками нейросетей — они могут обучать модели и ставить им задачи. В этой статье расскажу, почему считаю AI не соперником на рынке труда, а инструментом, который поможет нам стать более эффективными. А главное — поделюсь большой подборкой материалов для каждого, кто хочет сделать нейросети своими помощниками. 

Меня зовут Ваня Самсонов, за последние семь лет я собрал булшит-бинго из хайповых технологий: крипта + No-code + ML. Сейчас руковожу продуктовым направлением по ML ВКонтакте — и у меня две основные задачи.

  1. Сделать так, чтобы в компании не осталось людей, которые считают ML магией — перенести машинное обучение в плоскость понятной обыденности.

  2. Причинять пользователям добро и радовать их с помощью новых технологий (отвечаю за машинное обучение в обработке текстов, изображений и звука).

Как продакт, я слежу за трендами и вижу, что нейросети постепенно забирают часть работы у людей с интеллектуальными профессиями (разработчиков, маркетологов, дизайнеров, консультантов и т. д.). Но заменить их полностью не могут — сейчас нейросети не умеют работать с нечётко поставленными задачами и договариваться с другими моделями, как правильно поступить. В этих недостатках моделей кроется сила человека, и я постараюсь дать инструменты, которые помогут использовать её на полную. И кратко расскажу, как их применять.

Эта статья написана по мотивам моего выступления на конференции ProductCamp Moscow 2023 — можно посмотреть видео доклада.

Пока руководители не научатся чётко формулировать свои задачи, мы в безопасности — нейронки нас не заменят
Пока руководители не научатся чётко формулировать свои задачи, мы в безопасности — нейронки нас не заменят

Подборка ресурсов по ML и не только

Вот здесь я собираю все полезные материалы.

Этот документ с подборкой ресурсов уже активно распространяют, и это очень круто. Но именно эту версию я буду постоянно пополнять самой актуальной и интересной информацией по теме. Кстати, вы тоже можете предложить в документе полезные материалы.

Ресурсы разбиты на несколько блоков. В первомисследования учёных, которые помогут увидеть масштаб развития AI с точки зрения науки. Например, среди материалов есть огромный социальный отчёт сотрудников OpenAI и других исследователей о том, как большие языковые модели будут влиять на рынок труда в США. Они выяснили, что если все компании и предприятия в стране массово внедрят ML, у 80% работников AI может затронуть до 10% задач, а у 19% — до половины.

Во втором блокересурсы, которые помогут хакнуть ChatGPT и достать из его глубин информацию, которую он не захочет так просто вам отдавать. Почему не захочет — расскажу ниже. Этот блок самый быстроменяющийся — ещё вчера советы из статей оттуда могли работать, а сегодня эти хаки уже пофиксили и они больше не действуют.

В оставшихся блоках — материалы для знакомства со сферой ML. Я разделил их на три уровня, чтобы каждый мог выбрать, насколько глубоко хочет погрузиться в эту область знаний.

  • Третий блок пригодится тем, кому просто интересно, что происходит в ML-сфере. В него я добавил крутой подкаст о машинном обучении и подборку телеграм-каналов на тему AI.

  • В четвёртом блоке я собрал доклады и статьи, которые помогут разобраться, как работает искусственный интеллект в бизнесе и продуктах.

  • Пятый блокдля тех, кто хочет не просто разобраться, но и быть полезным другим людям в проектах, связанных с ML. В нём — курс для ML-продактов, тренажёр по SQL и другие обучающие материалы, которые помогут понять, что такое градиентный бустинг, почему так или иначе работают модели по генеративке и диффузии и многое другое.

Дальше расскажу, как использовать информацию из подборки, чтобы стать погонщиком нейросетей.

Какую работу могут сделать за нас нейросети, а какую — нет

Недавно мы с командой провели эксперимент, который показал, что нейросети могут справляться с интеллектуальной работой не хуже профессионалов. Мы попросили написать рекламные тексты маркетолога, который уже пять лет в профессии. Параллельно в течение 10 дней учили специалиста без знаний и опыта в маркетинге составлять промты в ChatGPT.

Что такое промты?

Промты — это текстовые запросы, которые описывают, какой ответ должна дать модель. Их мастерски умеют составлять специально обученные люди — промт-инженеры. Они знают тонкости запросов и могут быстро получить необходимый результат при работе с любой генеративной моделью: от ChatGPT до Midjourney.

После обучения всем тонкостям промта обученный специалист тоже создавал рекламу, но только с помощью нейросети. В итоге сложно было понять, какие тексты писал маркетолог, а какие — ChatGPT. Примеры — ниже. Такие небольшие тексты можно написать и за пять минут, это только часть креативов из большой работы. 

Я уверен, что такой же результат получится и в других сферах, где используют нейросети. Модели умеют уже очень многое: рисовать, генерировать звук и текст. Некоторые даже могут пройти капчу — они способны пойти в интернет, притвориться человеком со слабым зрением и попросить помощи в расшифровке картинок. Чего пока не умеют нейросети, так это ставить бизнес-задачи.

Модели хорошо могут выполнять декомпозированные задачи, но при этом сами не умеют планировать. Если что-то меняется, они не способны быстро перестроиться, хотя сейчас разработчики активно пытаются решить эту проблему. Пока такой расклад сохраняется, мы в безопасности — нас не заменят. Эту особенность нейросетей важно учитывать, когда вы будете ставить задачу — постарайтесь её максимально сузить. Не просите сразу разработать продающий и привлекательный сайт, а начните с конкретных кнопочек, текста для блоков, наполнения корзины и так далее.

«Вы сказали нарисовать кисть руки. Вот, пожалуйста — кисть с пальцами». Надо было просить более детально. Типичная ситуация с генерацией картинок в Stable Diffusion
«Вы сказали нарисовать кисть руки. Вот, пожалуйста — кисть с пальцами». Надо было просить более детально. Типичная ситуация с генерацией картинок в Stable Diffusion

В поисках сокровищ AI: зачем учиться составлять промты

Всё самое интересное спрятано в глубинах AI. Например, ChatGPT училась на огромном количестве данных, куда попали закрытые отчёты большой четвёрки, слитые данные компаний о том, как делать процессоры и платы, закрытые отчёты военных. Есть там и много такого, о чём лучше действительно не знать. Разработчики из OpenAI полгода работали над тем, чтобы модель не выдавала «чувствительную» информацию. Например, как сделать коктейль Молотова или добыть яд. В проектировании моделей этой проблеме посвящено отдельное направление: alignment. Его смысл в том, чтобы результаты работы AI соответствовали человеческим «целям и ценностям» и не вредили другим людям. Подробнее про alignment можно почитать в этой крутой статье

Чтобы извлечь из модели полезную информацию, нужно уметь составлять хорошие промты. Уже появились люди, которых называют джейлбрейкерами нейронных сетей, или по-простому — хакерами. С помощью хитрых приёмов они вытягивают информацию из самой глубины модели. Представьте хакера-маркетолога, который делает текстовые запросы нейросети и пытается дотянуться до того, что спрятано в ней. Пара недель — и он может вытащить информацию, за которую кто-то готов заплатить сотни тысяч долларов: например, большой отчёт Gartner.

Если вы разберётесь, как работает нейросеть, какие запросы ей давать и как она отвечает, то сможете докопаться до очень крутых вещей и сделать модель своим карманным помощником. Ваша задача — быть максимально любопытными и делать всё, чтобы модель пыталась вам ответить. Не верьте ей, если она будет говорить, что чего-то не знает или не умеет. Возможно, просто нужно по-другому сформулировать вопрос.

Как модели, плагины и погонщики нейросетей могут работать на бизнес

Чтобы модель решала задачи для бизнеса, она должна давать актуальную информацию. Обучение нейросети занимает 35–40 дней, так что к концу этого срока она ничего не будет знать про последний месяц. Модель нужно учить заново — придётся вновь собирать и чистить очень много данных. А на выходе она может деградировать и выдавать глупые вещи.

Основная сила модели в том, что ей не нужно держать в себе всю информацию. Ребята из OpenAI в марте запустили плагины, которые дают чат-боту доступ к актуальной информации из интернета и различным сервисам. Плагины позволяют боту в режиме реального времени выдавать, например, прогноз погоды, курс акций или результаты спортивных соревнований. Если модель умеет ходить в интернет, значит, она может зайти в любой из наших продуктов. С помощью этого нейросеть можно монетизировать. 

Есть и ещё одна вещь, которую модели потенциально могут делать — давать задание другим моделям. Представьте себе мир, где существует тысячи нейросетей, которые могут управлять друг другом. Тут на помощь придёт огромная база моделей Hugging Face. На сегодня в ней почти 200 тысяч моделей: какие-то из них лучше оптимизируют цены, другие заточены на рекомендации или расшифровывают тексты картинок. 

Возможно, через время авторы моделей будут объяснять в Hugging Face, какие задачи решает их модель, а продакты будут делать запросы на нейросети, которые принесут пользу бизнесу. Это будет мир, в котором любой любопытный и усидчивый человек может стать полноценным погонщиком нейросетей. И для этого ему не потребуется разработчик, как сейчас. Ему даже не надо будет задумываться, как модель достигла результата — достаточно чётко сформулировать задачу.

Чтобы комфортно общаться с моделью, нужно понимать, как она работает и какие задачи может решать. Я выделяю три группы специалистов по степени погружённости в ML-сферу.

  • Люди, которые знают про модели, могут написать промт в ChatGPT и получить необходимый результат, который потом ещё желательно перепроверить.

  • Специалисты, знающие про существование разных моделей по компьютерному зрению, звуку и ещё многих других. Они примерно понимают, какие задачи такие модели решают, но не знают, как их запустить и внедрить в бизнес или продукт.

  • Продакты, которые понимают, как работает машинное обучение, но не умеют писать код. Это нормально — им просто важно понимать, что до них хочет донести их разработчик. И уметь переработать эту информацию в метрики, по которым живёт бизнес.

Модели меняют наше мышление

В том, что модели не умеют декомпозировать задачи, есть неочевидная польза для нас. Многие люди тоже не умеют раскладывать большие задачи на маленькие и выполнять их поэтапно. Вместе с нейросетями мы получили тренировочный агрегат, который требует от нас ставить чёткие задачи, учит выстраивать план и разбивать сложные задачи на более простые. Он помогает структурировать наше мышление и даёт скиллы, которые было бы сложнее получать другими способами. А это делает нас лучше.

Не бойтесь использовать новые технологии в своей работе — теперь у вас есть инструменты для этого. Чем раньше вы их освоите, тем меньше шансов, что они вас заменят. И чем больше опыта вы получите в работе с нейросетями, тем больше возможностей сможете найти для их применения.

Комментарии (6)


  1. shadrap
    02.06.2023 06:30

    куда попали закрытые отчёты большой четвёрки, слитые данные компаний о том, как делать процессоры и платы, закрытые отчёты военных

    Откуда интересно это информация? Мне кажется это неотъемлемая часть хайпа для повышения интереса. Отчёты большой четвёрки публичные, а отчёты по аудированию её самой могут быть закрытыми, но вряд-ли на них можно построить обучение...,систематизация информации стоит несоразмерно больших денег..., то же относится к изготовлению процессоров- слить кусок информации одно,а построить на них обучение совсем другое...

    Расскажите пожалуйста по до обучение . У меня локально крутится Викуна,которую я дообучаю,но но конечно формат добавленной информации отягощает модель настолько,что она через некоторое время уже не шевелится... Т.е по хорошему нужна регенерация с новыми данными. Как это организовано на больших моделях?


    1. iSamsonov Автор
      02.06.2023 06:30

      Про закрытые доки из Big4 - это мои наблюдения и опыт ребят, которые хакали ChatGPT в первые месяцы.

      Уверен, что там же были отчёты Gartner и др крупных агенств и компаний, а оказались они там по довольно банальной причине - невнимательность людей:
      1) Big4 выпускает закрытый отчёт по чьему-нибудь заказу
      2) Передаёт заказчику персонально в руки или по почте
      3) Дальше заказчик передаёт копии всем заинтересованным:
      - иногда даже специально в переконвертирует в PDF без средств защиты, чтобы заинтересантам было проще открывать файлы с телефона или планшета (и передаётся через открытые ссылки в облаках и другие незащищенные каналы)
      - иногда такие отчёты вывешивают на сайте, давая доступ только к странице , где хвалят компанию или где описан тезис, который для заказчика репутационно важен
      - иногда такие отчёты сливают на форумы или площадки
      4) дальше краулер OpaenAI скачивает всё, до чего может дотянуться и в том числе удаётся дотянуться до такого отчёта
      5) бинго! теперь остаётся откапать эту инфу в глубинах LLM (с каждым месяцем это становится всё сложнее)


  1. MariaLi
    02.06.2023 06:30

    Спасибо за подборку материалов. Я погонщик-любитель и в опросе мне не хватило варианта «Использую пока только для хобби-проектов».


  1. vpetrov
    02.06.2023 06:30
    +1

    Оба текста в примере – одинаково плохие и требуют редактуры. Если маркетос на большее не способен, то немудрено, что его заменит чат-бот.


    1. iSamsonov Автор
      02.06.2023 06:30
      +1

      На вкус и цвет все карандаши разные))

      Заменит полностью вряд ли, тк
      1) заказчику зачастую нужно объяснить, что работа хорошо сделана и какая идея за ней стоит (как это делает Лебедев со своими логотипами)
      2) в какой-то момент маркетолог и рерайтер устают генерировать новые вариации, а машина будет создавать бесконечный контент, который талантливый профессионал сможет отредактировать и провести питч

      PS
      Думаю, что через некоторое время к некоторым изображениям и текстам будет приписка "создано без ИИ", как это произошло с ГМО.


      1. vpetrov
        02.06.2023 06:30
        +1

        Я ещё зимой думал добавить на свои сайты плашку типа "Всё сделано исключительно живыми людьми". Но подумал и отказался от этой идеи до времени.
        Хотя, думается, спрос на выраженный авторский контент будет только расти.