AI-ассистенты для кодинга в 2025: сравниваем GigaChat, Claude, GPT-4o и DeepSeek на реальных задачах / forpes.ru

Главная
AI-ассистенты для кодинга в 2025: сравниваем GigaChat, Claude, GPT-4o и DeepSeek на реальных задачах

AI-ассистенты для кодинга в 2025: сравниваем GigaChat, Claude, GPT-4o и DeepSeek на реальных задачах +3

04.06.2025 09:13

ITFB_Group 5 5300 Источник

В наши дни, кажется, каждый второй пишет AI-ассистента для разработчиков. Но работает ли это в реальности? Мы решили проверить на себе и сравнить самых популярных помощников.

Что делали и зачем?

Внутри команды (в ITFB Group) у нас 14 Java-разработчиков — от мидлов до уверенных сеньоров. Все мы работаем в боевом проекте, и стало интересно: может ли AI реально помочь в повседневной разработке, или это всё больше про хайп?

Взяли популярные инструменты, с которыми сейчас носятся по всему интернету, и попробовали использовать их так, как если бы это был наш коллега по команде — не ради тестов, а чтобы он реально помогал писать и читать код.

С кем мы имели дело

Инструменты и модели:

GigaIDE (отечественная IDE с моделью GigaChat)
Cursor IDE (форк VSCode с поддержкой Claude 4 и ChatGPT-4o)
Tabnine (можно подключить Claude или GPT-4o)
Codeium (работает с GPT-4o и DeepSeek-R1)

Цель была простая: разработчику должно быть удобно, быстро и полезно. А не просто «вот тебе код — сам разбирайся».

Как оценивали

Мы не придумывали формулы и сложные метрики. Просто взяли список того, что реально важно:

Может ли ассистент объяснить чужой код?
Насколько хорошо он генерирует новый код?
Понимает ли контекст?
Делает ли он полезные подсказки?
Можно ли вести с ним вменяемый диалог?
Насколько тормозит работу?

И самое главное — хочется ли его использовать дальше?

Победители и аутсайдеры (если коротко)

Модель	Диалог с кодом	Понимание	Код пишет	Полезен вообще?
Claude 4	Круто	Круто	Круто	Да
ChatGPT-4o	Хорошо	Норм	Круто	Да
DeepSeek R-1	Норм	Норм	Норм	Зависит
GigaChat	Странно	Так себе	Ок, но локально	Пока нет

Впечатления от моделей

Claude 4 Sonnet — почти как сеньор

Понимает, даже если ты пишешь невнятный запрос.
Сам предлагает рефакторинг.
Понимает, что ты хочешь, до того как ты понял.
Хорошо держит контекст по проекту.
Умеет рассуждать основываясь на истории чата и коде.

Один из наших коллег сказал: «Claude пишет код так, как будто ему не лень».

GigaChat — патриотично, но пока сыро

Контекст ограничен одним файлом — боль.
Нормально генерирует boilerplate-код.
Подсказки в GigaIDE мешают больше, чем помогают.
Иногда повторяет свои же предыдущие предложения — будто заело.
Но: можно поставить в защищённый контур, что важно для некоторых.

DeepSeek R-1 — бесплатный, локальный, но со своими «но»

Работает стабильно.
Код пишет без откровений, но прилично.
Можно развернуть локально — вообще без лишней бюрократии.
На удивление неплохо справляется с пояснениями (типа «как работает Spring Security»).

Некоторые из нас попробовали и Claude 4 Opus — это уже за гранью. Она справляется с огромными кодовыми базами, может по памяти оперировать большим контекстом, «видит» даже косвенные зависимости и архитектурные просадки.

Правда, стоимость использования Opus — пока что запредельная, особенно при интенсивной работе. Но это уже прям full-time AI напарник.

Что по инструментам (Плагины/IDE)

IDE	Удобство	Подсказки	Контекст	Скорость	Наш вердикт
Cursor	Круто	Хорошо	Круто	Круто	ЛидирующийUX
Tabnine	Норм	Норм	Хорошо	Круто	Ок-шный
Codeium	Норм	Норм	Хорошо	Норм	Приемлемо
GigaIDE	Так себе	Так себе	Хорошо	Хорошо	Много багов

Почему Cursor стал любимцем

Видит больше, чем просто файл — реально следит за тем, что ты делаешь.
Можно выделить блок кода и сказать: «сделай лучше» — и он делает.
Чат работает как ассистент, а не как поисковик.

Минусы:

Подсказки платные (ограничено по количеству).
VSCode-стайл — не всем Javaшникам заходит.

Примеры из практики

Claude 4
Задача: «Является ли фрагмент кода потокобезопасным?».
Ответ: разбивает бизнес-логику, отделяет интерфейсы, выносит адаптеры. Пишет последовательный human-like код (но не всегда рабочий).

GigaChat
Задача: «Сделай маппер DTO ↔ Entity».
Результат: делает, но без лишнего. Похоже на то, что сгенерил бы сам через IDE-шный шаблон.

DeepSeek R-1
Задача: «Как работает фильтрация запросов в Spring Boot?»
Ответ: даёт короткое объяснение, плюс пример, плюс ссылку на доку. Как будто ты загуглил, но быстрее.

Выводы

Если коротко, вот кому подойдёт что:

Ситуация	Что выбрать
Закрытый контур, безопасность важна	GigaIDE с лицензией / DeepSeek
Хочется просто крутого помощника	Cursor + Claude 3.5 или 4
Нет бюджета, но нужен ассистент	DeepSeek локально
Минимум настройки, всё из коробки	Tabnine с GPT-4o

Последнее слово

AI сейчас — это не «возможно когда-нибудь», а «почему бы не попробовать прямо сейчас». Мы протестили всё это на реальном проекте и получили кучу инсайтов. Самое главное — некоторые ассистенты уже стали частью повседневной разработки.

Конечно, AI-ассистенты не заменят разработчика, но они уже сейчас становятся частью среды разработки. Особенно в задачах рутинных: генерация boilerplate-кода, парсеры, JSON-мапперы, авто-тесты.

Если вы всё ещё пишете CRUD руками — попробуйте Claude или хотя бы DeepSeek. И да, они не идеальны. Но они уже реальны.

Комментарии (5)

smarkelov
04.06.2025 11:09
#28393852
Что запредельного в стоимости claude? Есть же план за 100 и 200 долларов в месяц, что для профессионального инструмента вполне норм, с огромными лимитами на claude code.

SeveR31
04.06.2025 11:09
#28393868
Codeium уже не существует, они переименовались в Windsurf

Alian3785
04.06.2025 11:09
#28395354
Вы что совершили популярную ошибку и перепутали 4о и о4?

cry_san
04.06.2025 11:09
#28396424
Нет бюджета, но нужен ассистент - DeepSeek локально
Это же какой нужен комп и за какие деньги, чтобы DeepSeek со вменяемой скоростью отвечал на ваши запросы. Нет бюджета - бесплатный чат в браузере.
1. Vasilesk
  04.06.2025 11:09
  #28403070
  Думаю, статья скорее про выбор корпоративного решения (со своими запросами на защищённость и приватность данных), и в этом случае "локально" – на серверах компании, что вполне реалистично по деньгам.