В наши дни, кажется, каждый второй пишет AI-ассистента для разработчиков. Но работает ли это в реальности? Мы решили проверить на себе и сравнить самых популярных помощников.

Что делали и зачем?

Внутри команды (в ITFB Group) у нас 14 Java-разработчиков — от мидлов до уверенных сеньоров. Все мы работаем в боевом проекте, и стало интересно: может ли AI реально помочь в повседневной разработке, или это всё больше про хайп?

Взяли популярные инструменты, с которыми сейчас носятся по всему интернету, и попробовали использовать их так, как если бы это был наш коллега по команде — не ради тестов, а чтобы он реально помогал писать и читать код.

С кем мы имели дело

Инструменты и модели:

  • GigaIDE (отечественная IDE с моделью GigaChat)

  • Cursor IDE (форк VSCode с поддержкой Claude 4 и ChatGPT-4o)

  • Tabnine (можно подключить Claude или GPT-4o)

  • Codeium (работает с GPT-4o и DeepSeek-R1)

Цель была простая: разработчику должно быть удобно, быстро и полезно. А не просто «вот тебе код — сам разбирайся».

Как оценивали

Мы не придумывали формулы и сложные метрики. Просто взяли список того, что реально важно:

  • Может ли ассистент объяснить чужой код?

  • Насколько хорошо он генерирует новый код?

  • Понимает ли контекст?

  • Делает ли он полезные подсказки?

  • Можно ли вести с ним вменяемый диалог?

  • Насколько тормозит работу?

И самое главное — хочется ли его использовать дальше?

Победители и аутсайдеры (если коротко)

Модель

Диалог с кодом

Понимание

Код пишет

Полезен вообще?

Claude 4

Круто

Круто

Круто

Да

ChatGPT-4o

Хорошо

Норм

Круто

Да

DeepSeek R-1

Норм

Норм

Норм

Зависит

GigaChat

Странно

Так себе

Ок, но локально

Пока нет

Впечатления от моделей

Claude 4 Sonnet — почти как сеньор

  • Понимает, даже если ты пишешь невнятный запрос.

  • Сам предлагает рефакторинг.

  • Понимает, что ты хочешь, до того как ты понял.

  • Хорошо держит контекст по проекту.

  • Умеет рассуждать основываясь на истории чата и коде.

Один из наших коллег сказал: «Claude пишет код так, как будто ему не лень».

GigaChat — патриотично, но пока сыро

  • Контекст ограничен одним файлом — боль.

  • Нормально генерирует boilerplate-код.

  • Подсказки в GigaIDE мешают больше, чем помогают.

  • Иногда повторяет свои же предыдущие предложения — будто заело.

  • Но: можно поставить в защищённый контур, что важно для некоторых.

DeepSeek R-1 — бесплатный, локальный, но со своими «но»

  • Работает стабильно.

  • Код пишет без откровений, но прилично.

  • Можно развернуть локально — вообще без лишней бюрократии.

  • На удивление неплохо справляется с пояснениями (типа «как работает Spring Security»).

Некоторые из нас попробовали и Claude 4 Opus — это уже за гранью. Она справляется с огромными кодовыми базами, может по памяти оперировать большим контекстом, «видит» даже косвенные зависимости и архитектурные просадки.

Правда, стоимость использования Opus — пока что запредельная, особенно при интенсивной работе. Но это уже прям full-time AI напарник.

Что по инструментам (Плагины/IDE)

IDE

Удобство

Подсказки

Контекст

Скорость

Наш вердикт

Cursor

Круто

Хорошо

Круто

Круто

ЛидирующийUX

Tabnine

Норм

Норм

Хорошо

Круто

Ок-шный

Codeium

Норм

Норм

Хорошо

Норм

Приемлемо

GigaIDE

Так себе

Так себе

Хорошо

Хорошо

Много багов

Почему Cursor стал любимцем

  • Видит больше, чем просто файл — реально следит за тем, что ты делаешь.

  • Можно выделить блок кода и сказать: «сделай лучше» — и он делает.

  • Чат работает как ассистент, а не как поисковик.

Минусы:

  • Подсказки платные (ограничено по количеству).

  • VSCode-стайл — не всем Javaшникам заходит.

Примеры из практики

Claude 4
Задача: «Является ли фрагмент кода потокобезопасным?».
Ответ: разбивает бизнес-логику, отделяет интерфейсы, выносит адаптеры. Пишет последовательный human-like код (но не всегда рабочий).

GigaChat
Задача: «Сделай маппер DTO ↔ Entity».
Результат: делает, но без лишнего. Похоже на то, что сгенерил бы сам через IDE-шный шаблон.

DeepSeek R-1
Задача: «Как работает фильтрация запросов в Spring Boot?»
Ответ: даёт короткое объяснение, плюс пример, плюс ссылку на доку. Как будто ты загуглил, но быстрее.

Выводы

Если коротко, вот кому подойдёт что:

Ситуация

Что выбрать

Закрытый контур, безопасность важна

GigaIDE с лицензией / DeepSeek

Хочется просто крутого помощника

Cursor + Claude 3.5 или 4

Нет бюджета, но нужен ассистент

DeepSeek локально

Минимум настройки, всё из коробки

Tabnine с GPT-4o

Последнее слово

AI сейчас — это не «возможно когда-нибудь», а «почему бы не попробовать прямо сейчас». Мы протестили всё это на реальном проекте и получили кучу инсайтов. Самое главное — некоторые ассистенты уже стали частью повседневной разработки.

Конечно, AI-ассистенты не заменят разработчика, но они уже сейчас становятся частью среды разработки. Особенно в задачах рутинных: генерация boilerplate-кода, парсеры, JSON-мапперы, авто-тесты.

Если вы всё ещё пишете CRUD руками — попробуйте Claude или хотя бы DeepSeek. И да, они не идеальны. Но они уже реальны.

Комментарии (4)


  1. smarkelov
    04.06.2025 11:09

    Что запредельного в стоимости claude? Есть же план за 100 и 200 долларов в месяц, что для профессионального инструмента вполне норм, с огромными лимитами на claude code.


  1. SeveR31
    04.06.2025 11:09

    Codeium уже не существует, они переименовались в Windsurf


  1. Alian3785
    04.06.2025 11:09

    Вы что совершили популярную ошибку и перепутали 4о и о4?


  1. cry_san
    04.06.2025 11:09

    Нет бюджета, но нужен ассистент - DeepSeek локально
    Это же какой нужен комп и за какие деньги, чтобы DeepSeek со вменяемой скоростью отвечал на ваши запросы. Нет бюджета - бесплатный чат в браузере.