Интро
Искусственный интеллект проникает повсюду. Если он нас ещё физически не захватил, то информационное поле уже почти всё занял. Каждую неделю появляются новости о том, что ИИ стал ещё лучше и скоро заменит те или иные профессии. Но если посмотреть на реальные показатели, картина не столь радужная: даже топовые модели ошибаются на сложных задачах, а компании иногда получают сбои после внедрения AI и принимают меры. Но кажется, что мир понемногу меняется, и глупо сегодня это игнорировать и не пробовать.
В этой статье хочется рассказать, что уже сегодня может попробовать среднестатистический айтишник, который не особо погружался в эту тему.

О чем статья
В статье будут базовые примеры и пояснения, как можно настроить и попробовать ИИ для рефакторинга кода или других задач. Мы не будем сравнивать модели по качеству, так как для этого есть специальные рейтинги и бенчмарки. Удовлетворительный результат для нас будет, если за приемлемое время (пару минут) модель сделает то, что мы хотим. И естественно, хочется это всё бесплатно, так как мы только начинаем этот путь в мир ИИ. Фактор бесплатности здесь больше обусловлен стремлением понять азы и попробовать, подходит вам эта модель взаимодействия с AI или нет, прежде чем погружаться с головой в этот мир и покупать недешевые подписки.
Немного истории
Если сегодня слышишь ИИ, то обычно речь идет о LLM (она же Большая языковая модель). Большая, потому что там очень много параметров (миллиарды и более). Если упростить до сути, то это черный ящик, основанный на нейронной сети, который статистически умеет предполагать и очень хорошо, следующий токен (например, слово) на основе предыдущего текста. Черный ящик — я написал не просто так, понять почему модель дала именно этот ответ на вопрос, задача очень и очень сложная.
Если посмотреть, как ИИ начало проникать в ИТ-среду с точки зрения ее использования, то сначала их использовали для автодополнения кода, например, GitHub Copilot. После этого появились способы коммуникации с ИИ через чаты, решения наподобие ChatGPT. Где приходилось копировать код из IDE в чат и обратно, что не совсем удобно. Сегодня самым интересным решением является взаимодействие с ИИ через агентов. Агенты — если упрощенно, то это приложения, которые вы ставите к себе на компьютер и они, общаясь с ИИ, могут менять ваши локальные файлы. Их исполнение может быть различным: консольные утилиты, как плагин для IDE, приложения со своим UI. Но основной подход один, они меняют ваши файлы, выполняя задачу которую вы поставили и при этом обращаются с ИИ по API (то есть отправляя запросы через интернет к серверам компании).
Стоит еще немного рассказать про один вариант использования ИИ, о котором мы не упомянули — это так называемые AI-first IDE, IDE специально созданные для написания кода с помощью ИИ, их яркие представители - это Cursor, Zed и много других.
На самом деле сфера ИИ сейчас очень быстро развивается, появляются новые модели, агенты и чаты настолько быстро, что уследить за этим очень сложно. Возможно, в этой статье я что-то пропустил, или это уже устаревшие данные, поэтому советую немного погуглить и посмотреть рейтинги моделей и агентов, возможно уже что-то новое будет поинтереснее, чем примеры в статье.
Агенты
Мы уже поняли, что нам нужен агент, который будет менять наш код, используя ИИ. Сегодня практически у каждой компании, у которой есть своя LLM и чат для взаимодействия, есть и своё приложение (агент) для работы с кодом. Вот самые яркие представители:
Claude Code — от Anthropic, их решения для кода сегодня занимают верхние позиции в рейтингах
Codex — от OpenAI
Qwen Code — от Alibaba
и много других от разных компаний
Отдельно хочется отметить агенты, которые могут работать с различными моделями, обычно это агенты с открытым исходным кодом:
В статье мы посмотрим только на два из них: Claude Code и Kilo Code, почему именно они, по моему мнению, это одни из самых популярных и/или набирающих популярность решений. Но можете взять любые другие, благо их много, на любой вкус и цвет. Claude Code мы будем использовать как консольное приложение, а Kilo Code — как плагин в VS Code для разнообразия. Установить их довольно просто, и есть много гайдов в интернете, не будем на этом останавливаться.
Бесплатно и ограничено
Первое, что приходит в голову поискать бесплатные предложения. Так как сейчас идет гонка ИИ, то многие компании борются за рынок и дают бесплатный доступ к некоторым моделям с ограничениями для вовлечения пользователей. Ресурсы, где можно найти бесплатный доступ к моделям:
OpenRouter — агрегатор-прокси к разным моделям, есть порядка десятка бесплатных моделей, но не самых популярных.
Kilo Code — после установки у него из коробки есть парочка бесплатных моделей, но с ограничениями.
Модели доступные в Kilo Code во время написания статьи

Qwen Code — дает бесплатный доступ и 1,000 бесплатных запросов в день. Установив qwen и получив токен, можно этот токен использовать в любом другом агенте. Остановимся на нем для дальнейших экспериментов.
Уверен, что есть и другие способы и ресурсы с бесплатными моделями.
Важное уточнение: бесплатные квоты часто имеют ограничения по частоте запросов (RPM) и дневному лимиту, и их может не хватить на интенсивную работу, но для базового сценария и для первых проб мне обычно хватает.
Получаем токен через Qwen
Установить Qwen Code несложно — есть гайд и даже на русском.
После того, как установили, нужно его запустить простой командой qwen и авторизоваться. Командой /auth выбираем Qwen OAuth.
Как выглядит qwen

Нас перенаправит на сайт, на котором нужно будет создать аккаунт, и после этого мы получим 1,000 бесплатных запросов в день. Можно спокойно закрывать консоль. Сам же токен, который нам нужен для экспериментов, будет находиться в файле oauth_creds.json, на MacOS он находится в скрытой папке по пути /Users/user/.qwen/oauth_creds.json. Нам нужен будет access_token из этого файла.
На самом деле можно уже использовать Qwen Code как агента для написания кода, но мы пойдем дальше и будем использовать модель qwen через других агентов.
Kilo Code и Qwen
Kilo Code мы будем использовать через плагин для VS Code, есть также плагин для IDEA и CLI. Плагин поставить просто, настроить тоже довольно просто, так как Kilo Code имеет встроенную интеграцию с Qwen Code и многими другими провайдерами. После этого важно переключить все профили в выпадающем списке на нашу модель.
Конфигурация для Qwen code

Не забыть переключить профиль на qwen

Claude Code и Qwen
Тут немного сложнее, так как у Claude Code немного другой API, нам нужно прокси, которая будет преобразовывать запросы от Claude Code в универсальный формат для LLM. Для этого мы воспользуемся Claude Code Router. Нам нужно установить claude-code и claude-code-router. Есть довольно простая инструкция, как это сделать.
После этого создаем конфигурационный файл ~/.claude-code-router/config.json и меняем там api_key на access_token от Qwen.
Содержание файла config.json
{ "LOG": true, "LOG_LEVEL": "info", "HOST": "127.0.0.1", "PORT": 3456, "API_TIMEOUT_MS": 600000, "Providers": [ { "name": "qwen", "api_base_url": "https://portal.qwen.ai/v1/chat/completions", "api_key": "access_token_from_.qwen/oauth_creds.json", "models": [ "qwen3-coder-plus", "qwen3-coder-plus", "qwen3-coder-plus" ] } ], "Router": { "default": "qwen,qwen3-coder-plus", "background": "qwen,qwen3-coder-plus", "think": "qwen,qwen3-coder-plus", "longContext": "qwen,qwen3-coder-plus", "longContextThreshold": 60000, "webSearch": "qwen,qwen3-coder-plus" } }
Далее запускаем Claude Code Router командой ccr restart и затем запускаем Claude Code через роутер командой ccr code. После этого можем спокойно пользоваться Claude Code, где под капотом будет работать модель от Qwen.
Пробуем работоспособность
Для проверки работоспособности возьмем простой Java-код и попросим наших агентов его отрефакторить
Код для рефакторинга
import java.util.*; public class DataProcessor { public List<Map<String, Object>> processData(List<Map<String, Object>> data, Map<String, Object> options) { if (options == null) { options = new HashMap<>(); } List<Map<String, Object>> result = new ArrayList<>(); for (Map<String, Object> item : data) { if (item.containsKey("price") && item.containsKey("quantity")) { double price = ((Number) item.get("price")).doubleValue(); int quantity = ((Number) item.get("quantity")).intValue(); double discount = options.containsKey("discount") ? ((Number) options.get("discount")).doubleValue() : 0.0; double total = price * quantity * (1 - discount); Map<String, Object> processedItem = new HashMap<>(); processedItem.put("name", item.getOrDefault("name", "Unnamed")); processedItem.put("total", total); if (total > 100) { processedItem.put("category", "expensive"); } else { processedItem.put("category", "cheap"); } result.add(processedItem); } else { System.out.println("Skipping item: " + item); } } return result; } public static void main(String[] args) { DataProcessor processor = new DataProcessor(); List<Map<String, Object>> data = new ArrayList<>(); Map<String, Object> item1 = new HashMap<>(); item1.put("name", "Laptop"); item1.put("price", 1000); item1.put("quantity", 1); data.add(item1); Map<String, Object> item2 = new HashMap<>(); item2.put("name", "Mouse"); item2.put("price", 25); item2.put("quantity", 2); data.add(item2); Map<String, Object> item3 = new HashMap<>(); item3.put("price", 50); item3.put("quantity", 3); data.add(item3); Map<String, Object> item4 = new HashMap<>(); item4.put("name", "Keyboard"); item4.put("price", 80); item4.put("quantity", 1); data.add(item4); Map<String, Object> options = new HashMap<>(); options.put("discount", 0.1); List<Map<String, Object>> result = processor.processData(data, options); System.out.println(result); } }
Задание для агентов
Perform a refactoring of the following "spaghetti code" in DataProcessor.java. Requirements: 1. Break down the monolithic method into logical classes with proper separation of concerns (e.g., a separate class for calculations, another for data processing). 2. Add error handling (use exceptions instead of printing to console). 3. Write Javadoc for each new class and method. 4. Briefly explain the architectural changes you made and why.
Оба агента справились примерно за полторы-две минуты — на мой взгляд, это отличный результат. Хоть результаты их получились разные (оценивать качество которых мы не будем), но возможность использовать бесплатных, хоть и ограниченных помощников мы продемонстрировали.
Вместо итогов
Если вы еще никогда не пробовали AI помощников для написания кода и делегирования им части своей работы, то настоятельно советую попробовать. Возможно, вам понравится и вы увидите их пользу, если нет, то это тоже опыт и результат. При этом эта статья, надеюсь, поможет вам не покупать подписку на платную модель, которая не всегда дешевая, а попробовать это бесплатно и решить, нужно ли вам платное решение или нет.
Результаты работы агентов можно посмотреть на GitHub.
UPD
После выхода статьи вышел релиз Qwen 3.6. Как отметил пользователь @svfolder2021 решение через Qwen Code в Kilo Code пока не работает. Я проверил — для Claude Code тоже, возвращается ошибка 400 на запрос. Есть issue на GitHub, будем надеяться, что разработчики его поправят.
На данный момент в Kilo Code и Qwen Code можно бесплатно использовать новую модель Qwen 3.6 Plus без дополнительных настроек.
Комментарии (25)

nikulin_krd
04.04.2026 18:52Я может чего-то не понял, но в чем смысл статьи? Это прям какая-то статья капитана очевидность - никаких сравнений нет, просто подключаем бесплатную LLM, которая "о чудо" пишет код...

Triton5
04.04.2026 18:52За опубликованную статьи Хабр автоматически увеличивает "карму" на 1 единицу:)

sergio5990 Автор
04.04.2026 18:52Согласен, глубокого исследования здесь нет. Статья больше для новичков: что установить, как подключить бесплатную LLM и попробовать ее без подписки. И потом уже решиться нужно покупать подписку или нет.

so_linrun
04.04.2026 18:52modelscope
500 звонков на модель в день, до 2000 звонков
Жаль, что Alibaba Cloud ужесточила высокую модель
svfolder2021
04.04.2026 18:52В данной статье не идет речь про работу через API, речь про работу через qwen.portal и Qwen Code через OAuth и Alibaba Cloud в этом процессе не учавствует.

achekalin
04.04.2026 18:52500 звонков на модель в день
Вы про "500 calls to model per day"? Не, я понимаю боты, но вот @so_linrun прямо жжет, и остальные его комменты почитать - там просто китайская маленькая модель.

marsden
04.04.2026 18:52Интересно, что примерно в это же время кило сломался, на гитхабе повалили ишью с проблемами и пометкой bug.... Совпадение?....

sergio5990 Автор
04.04.2026 18:52Возможно, но я думаю проблемы скорее вызваны большим обновлением и новой версией 7.*, я все проверял на 5.11.0. На нужную версию можно откатиться в VS Code.

aladkoi
04.04.2026 18:52Мой совет из опыта, даже не стоит пробовать кодить на этих моделях, если только чисто "время потратить".

XODOK5
04.04.2026 18:52Не знаю в чём разница, но в Visual Code можно установить Qwen Code и просто авторизоваться и можно использовать последнюю на данный момент модель без ограничений, ограничения только по контексту.

sergio5990 Автор
04.04.2026 18:52Cогласен с вами. Просто у Qwen Code только модели от Qwen. У таких решений как Kilo Code, Open Code бывают бесплатные модели от многих компаний, что иногда полезно

XODOK5
04.04.2026 18:52Да, но пока в сравнении с остальными бесплатными которые там есть, то Qwen их опережает, также можно добавить российские расширения GigaChat и от яндекса SourceCraft Code Assistant

svfolder2021
04.04.2026 18:52Килокод перестал работать с квен код сегодня, после выхода 3.6 версии, выдает ошибку 400 неверный запрос. Перепробовал целый список разных моделей, ничего не получается.

sergio5990 Автор
04.04.2026 18:52Спасибо, перепроверил, действительно выдает ошибку 400. Добавил UPD в статью.

XODOK5
04.04.2026 18:52И ещё Openrouter часто теряет связь, а Kilo Code вообще заблокирован

svfolder2021
04.04.2026 18:52Вы хотели сказать что заблокирован килокод провайдер, а не сам килокод. Пользуюсь килокодом в PHPStorm 6+ месяцев + Qwen Code без каких либо проблем и трехбуквенных решений.

XODOK5
04.04.2026 18:52Не знаю что именно заблокировано, но именно в VS Code через расширение он не подключается к серверу и без разницы какую модель нейросети выбрать

svfolder2021
04.04.2026 18:52Ну так надо выбрать другого провайдера, а не килокод провайдер. В настройках там масса провайдеров, и их нужно настраивать.https://c2n.me/4nRqCtL

devoln
04.04.2026 18:52В Windsurf бесплатно и безлимитно с недавних пор дают Kimi k2.5. Где-то читал, что она якобы не хуже Sonnet 4.5, по моему опыту она неплоха, но даже GPT 5.2 Low, доступная в Windsurf Free с ограниченной квотой, её уделывает. Думал купить там подписку, но пока был на триале, они ввели дебильную систему дневных и недельных квот для платных моделей, которые слишком быстро заканчивались даже на GPT 5.4, не говоря уже о Claude, который жрёт квоту как не в себя.
Ещё Codex на бесплатном тарифе есть, но это временно. А если подключить зарубежную карту (в РФ я завёл виртуальную по цене месяца подписки), то дают триал Plus на месяц с удвоенной квотой - временно, как они утверждают на сайте. Но даже удвоенную недельную квоту я потратил за два дня, сидя по 12 часов в день и документируя, покрывая тестами и добавляя инфраструктурные фичи в два моих проекта.
Мне интересно, почему все везде пишут только про Claude Code? Я его не пробовал, так как говорят, что там квоты улетают в миг, и нужно платить кучу денег, а у меня хороший опыт с Codex, а бесплатный Windsurf помогает дотянуть до восстановления недельной квоты Codex'а, за которую многое успеваю сделать и претензий к качеству не имею.
Triton5
Я за последние три дня на бесплатных Qwen3.6 потратил 200 млн токенов. Мне Qwen3.6 понравился гораздо больше, чем Claude Sonnet-4.5. По моему ощущению, Qwen3.6 это игрок высшей лиги:)
Использовал Qwen3.6 через деcктопную версию OpenCode.
sergeym69
Прогонял тест конверсии идеи из С# кода в реализацию на другом фреймворке в Python
Тесты запускал в Roo Code под VS Code, сперва составить план, потом реализовать план.
Образец брал реализацию GPT5.4 и потом так-же с помощью GPT5.4 сравнивал результаты разных моделей. Получилось порядок по качеству. Cортировка по убыванию качества реализации и количеству ошибок в реализации. Ошибка это неправильная реализация алгоритмов расчета.
GPT5.4-Medium - Sonnet 4.6 - качество примерно на одинаковом уровне
GPT5-mini
Qwen3.5-122b Q4-КМ локально 12tok/sec
Qwen3-coder-next Q4-КМ локально 26tok/sec
Haiku 4.5
Qwen3-235b Q3-KS локально 7 tok/sec
gpt-oss-120b - локально 24 tok/sec
MiniMax-M2.5 Q3-KS локально 15tok/sec
Qwen3.6
В общем как-то так получилось, локальная машина i7-265K, 128Gb DDR5, RTX3090-1шт
Суммарно 1день на это потратил, но теперь хоть примерно понятно, что мне пдоходит, как резервный вариант.
Получилось Qwe3.5-122b оптимально, но не очень быстро, зато мультимодальная, либо если надо быстро то Qwen3-coder-next.
Ну или можно GPT5-mini гонять, она пока бесплатная в Github Copilot
roman_ag
Из семейства qwen для кода Qwen3.5-27B попробуй. ИМХО: значительно лучше работает, чем Qwen3-Coder-Next.
aladkoi
Анализ и код пишут на опус 4.6, на сонет запускают субагентов для более простых задач типа анализ логов, запуск сценариев.
achekalin
А как получить 200М токенов бесплатно, пусть и за 3 дня? У меня его "задора" хватает ненадолго (т.е. совсем ненадолго)...
AscendingRay
На openrouter он в подарок(free), насколько никто не знает, но там его сейчас просто заливают токенами!)