12 марта текущего года компания Cognition Labs представила Devin AI, первого в мире, по словам разработчиков, полностью автономного ИИ-программиста. В своем блоге Cognition написали: «Devin может планировать и выполнять сложные инженерные задачи, вспоминать соответствующий контекст на каждом этапе, учиться со временем и исправлять ошибки». Они также продемонстрировали аудитории способности ИИ на реальном примере с сайта Upwork, из-за чего в начале весны вызвали волну обсуждений и заставили программистов опасаться за свои рабочие места.

Однако, похоже, можно спокойно выдохнуть, поскольку недавно компания была обвинена во лжи. Пользователи сомневаются в работоспособности Devin AI, называя примеры из промо-видео фейками и указывая на то, что выпущенный продукт совсем не соответствует действительности.

Все началось с комментария одного из пользователей на Reddit под постом, где обсуждалась новинка в мире искусственного интеллекта — Devin AI. Сейчас сам пост уже удален, однако комментарий можно найти по ссылке.

Пользователь под ником minegen88 пишет: «Это похоже на скам. Типа на самом деле? Посмотрите на их сайт... разве они не могут использовать Devin, чтобы сделать его лучше???». Также в своем комментарии он приводит ряд доказательств, которые мы проверили и подробно разобрали.

1. Сайт Devin AI

Сайт компании Cognition выглядит, мягко говоря, не очень. Он состоит из двух страниц и на первый взгляд скорее напоминает работу студента, который только изучает основы web-разработки. Но, внешний вид - вещь субъективная, поэтому давайте разберемся, что же находится “под капотом”.

Первое, что бросается в глаза при открытии devtools — все сделано на Webflow, конструкторе для лендингов. А блог, который на сайте компании тоже есть, на самом деле является статичной страничкой. Действительно, имея под рукой ИИ, который заточен именно под разработку, почему Cognition не могли использовать Devin AI и создать с его помощью хорошее web-приложение?

Код, взятый с сайта компании Cognition Labs (https://www.cognition-labs.com/)
Код, взятый с сайта компании Cognition Labs (https://www.cognition-labs.com/)

К сайту с самим Devin AI у пользователей тоже появились вопросы. Интерфейс, который изображен в промо-видео не соответствует реальному. Более того, протестировать технологию пока тоже не получится. Можно лишь запросить доступ, оставив свою электронную почту.

Также пользователи Reddit с помощью React Developer Tools успели выяснить, что первое время сайт и вовсе работал в dev-моде. Благодаря dev-моду можно получать сообщения об ошибках и предупреждениях прямо в консоль, однако страдает производительность и размер бандла больше, чем в production-моде. Стоит упомянуть о том, что на сегодняшний день, даже если такая проблема и была в первые дни запуска, разработчики (а может и сам Devin AI) уже все давно пофиксили.

Первая картинка - скриншот с сайта https://preview.devin.ai/. Вторая - скрин одного из промо-роликов
Первая картинка - скриншот с сайта https://preview.devin.ai/. Вторая - скрин одного из промо-роликов

2. Несостыковки в промо-роликах

Раз возможности протестировать Devin AI у простых пользователей пока нет, давайте подробнее разберем видеоролики от Cognition с демонстрацией работы ИИ.

Начнем с промо-ролика, который завирусился больше всего и вызвал в среде разработчиков определенный ажиотаж. В нем Девин решает задание с Upwork и справляется с ним, доказывая, что ИИ вскоре сможет заменить человека даже в комплексных задачах. Однако, внимательный зритель может заметить, что задание для ИИ было выбрано неслучайно (см. на поиск на видео - таймкод 3:48), скорее всего для того, чтобы выставить Девина в самом выгодном свете. Ничего страшного, конечно, это вполне распространенная практика. Однако тогда странно, что ИИ подается пользователю как «AI-программист, способный выполнить любую задачу».

На англоязычном ютубе уже можно найти несколько разоблачений. Одно из них — с канала Internet of Bugs. В нем программист с 35-летним опытом в разработке по имени Карл подробно разбирает промо-видео и находит в нем множество несостыковок и пробелов. Например, оказалось, что Davin AI сначала создает файлы, которых изначально не было в репозитории задания с Upwork, а потом сам же находит в них ошибки и занимается их исправлением. У человека, который не вникал в код, показанный в промо-роликах, создается впечатление, что Девин способен искать ошибки в файлах, которые были ему предоставлены. Однако примеров исправления кода, который бы действительно существовал в репозитории, а не того, что был придуман в процессе самим ИИ, нам так и не показали.

3. Умалчивание неудобных фактов

Давайте посмотрим на то, сколько времени Devin AI понадобилось на то, чтобы выполнить все ту же задачу с Upwork. Первое сообщение для уточнения задачи было отправлено в 15:24. Последнее сообщение с ревью финального результата - в 21:41. Как итог — работа Девина над задачей заняла чуть больше, чем 6 часов. Опытный разработчик, в свою очередь, справился с точно такой же задачей примерно за полчаса (https://youtu.be/tNmgmwEtoWE?t=1095&si=GXy78TXkYl1Lstgz).

Скриншоты из промо-ролика
Скриншоты из промо-ролика

Безусловно, технология достаточно новая и ждать от AI идеального результата бессмысленно. Однако ни в одном из роликов не упоминается о том, что генерация значительного объема кода занимает больше времени, чем может показаться обывателю. Создается ощущение, что вся пиар-компания Devin AI — это намеренная попытка шокировать зрителя, убедить всех в том, что искусственный интеллект развивается быстрее, чем это происходит на самом деле.

Точно такие же ошибки и несостыковки встречаются почти в каждом видеоролике, опубликованном Cognition Lab.

Итог. Останутся ли программисты без работы?

Судя по количеству мемов, которые за последнюю неделю опубликовали пользователи в социальных сетях, определенно нет. В ближайшие несколько лет такая участь программистам не грозит. Существование подобных ИИ инструментов сможет лишь ускорить выполнение рутинных задач, искать и объяснять ошибки, местами исключать человеческий фактор. Однако, с этим уже сейчас прекрасно справляются модели, которые давно находятся в открытом доступе — ChatGPT-4 Turbo или Claude-3 Opus, доступ к которым (а еще к многим другим моделям, как например Midjourney, Dalle, Gemini) можно получить через Bothub.

Мемы из социальной сети X (Twitter)
Мемы из социальной сети X (Twitter)

Программирование сейчас — не столько про написание кода, сколько про понимании проблемы заказчика, коммуникацию с клиентом и командой. Этого невозможно достичь, если использовать только искусственный интеллект и полностью исключить вмешательство человека.

Даже если функционал Devin AI в промо-роликах был случайно или намеренно преувеличен, технология может стать отличным помощником для разработчиков. Сомнительно, что в скором времени ИИ сможет самостоятельно решать комплексные проблемы, фиксить баги и писать идеальный код без ошибок, как было заявлено. Живого разработчика виртуальный программист заменить пока не сможет.

Расскажите, используете ли вы AI в разработке? Если да, то как часто и для каких целей?

Комментарии (15)


  1. Politura
    18.04.2024 14:54
    +2

    Докопались до каких-то мелочей. Я не спец по генеративным сетям, но по-моему проблема совсем в другом: максимальный размер контекста, которым они могут оперировать, это длинна промпта. То, что показанно в ролике, когда он там читает документацию, потом использует полученные из нее знания на то, чтоб выполнить задание, никак в максимальный размер промпта не лезет. Отсюда есть подозрения в мошенничестве.


    1. jstmeowme Автор
      18.04.2024 14:54
      +3

      Разбор сделан на основе треда с реддита + добавила инфу из разоблачений с ютуба) А так да, то, что Cognition удалось избежать проблем с длиной контекста сомнительно. Я просто не представляю, насколько такая штука должна быть мощной. У того же gpt максимум - 32к, а для масштабных задачек в духе "проанализируй репо и сделай таску" нужно явно больше


      1. keydach555
        18.04.2024 14:54
        +1

        Google пару дней назад вроде бы заявила, что решила вопрос с контекстом, теперь он фактически может быть бесконечным. Без квадратичного увеличения вычислений при линейном росте как раньше. Если это так (а скорее всего так) - вопрос создания таких сеток как devin вопрос ближайших месяцев. Если они уже не созданы под маркой gpt-5 и не тестируются в open ai прямо сейчас


      1. TommyG
        18.04.2024 14:54
        +3

        . У того же gpt максимум - 32к

        Gemini 1.5 700k слов, или примерно как все книги про Гарри Поттера.

        Ну и конечно это не лимит.


  1. kuzzdra
    18.04.2024 14:54
    +9

    Действительно, имея под рукой ИИ, который заточен именно под разработку, почему Cognition не могли использовать Devin AI и создать с его помощью хорошее web-приложение?

    Сапожнмик должен быть без сапог! ;)
    Когда мне звонят с невероятно выгодным предложением - вложить 1000 баксов в супервыгодный проект, и через пару месяцев у меня будет 2000 - я спрашиваю как же они такие умные не вложили туда свои деньги и не заработали за год все деньги мира, зачем им моя 1000. На этом разговор как-то заканчивается ;)


  1. alysnix
    18.04.2024 14:54

    чтобы AI умел хорошо программировать, ему нужно лишь научиться декомпозиции. две любые максимально непохожие задачи на самом нижнем уровне есть лишь набор весьма похожих присваиваний, условных операторов, вызовов функций и циклов.

    но способность к декомпозиции, то есть разбиению на логические связанные, относительное независимые от окружения, куски - не видится таким уж сложным навыком. Для этого даже есть вполне аналитические алгоритмы, навроде алгоритмов кластеризации.

    так что будем оптимистами - разгонит скоро ИИ нас, программистов, поганой метлой, с наших насиженых мест :o)


    1. keydach555
      18.04.2024 14:54

      думаю, год еще есть в запасе ) потом да, разгонит, как дизайнеров и копирайтеров


      1. jonic
        18.04.2024 14:54
        +1

        Ой да ладно, мы просто будем делать больше работы за меньшие деньги (а если повезет за большие)


    1. perfect_genius
      18.04.2024 14:54
      +1

      Т.е. врать ему в коде будет сложнее, чем во всём остальном?


      1. Robastik
        18.04.2024 14:54

        Ничто не мешает ему итерировать нахождение ошибок и их исправление.


        1. randomsimplenumber
          18.04.2024 14:54
          +1

          Не хватает 2 кнопок: "сделать хорошо" и "сделать хорошо и правильно".


  1. micronull
    18.04.2024 14:54
    +2

    Правильно ли я понимаю, что для работы Devin AI и ему подобных, нужен полный доступ к ПК?

    Т.ч. разрешения на создание и редактирование файлов, выполнение программ и доступ в сеть.

    Кажется становится понятно как нейронки захватят мир.


  1. zabanen2
    18.04.2024 14:54
    +1

    чем ваша статья будет отличаться от того, что можно нагенерить через chatgpt? в этой статье идет какой-то технический разбор внутрянки? грубо говоря, ваши методы сравнения будут схожи с теми, что будет делать шаман, вызывая тем или иным образом дождь.

    ну и классическое: раз девил ии (какой-то стартап) не смог, то и любые нейросетки не смогут. lда еще полностью игнорируя copilot/chatgpt4/kite/tabnine


  1. Melonom
    18.04.2024 14:54
    +1

    Все началось с комментария одного из пользователей на Reddit под постом,
    где обсуждалась новинка в мире искусственного интеллекта — Devin AI.
    Сейчас сам пост уже удален

    А почему?


  1. DarthVictor
    18.04.2024 14:54

    Если у вас есть сетка, способная заменить программистов, то вы не предлагаете её программистам, вы открываете аутсорс и тихо забираете себе весь рынок разработки. Стартапы вроде Cognition действительно несут угрозу разработке, но не потому что заменяют разработчиков, а потому что снижают доверие к отрасли.

    Написал я про этот стартап месяц назад.