Способы написания кода с АИ
Принципиально есть несколько способов писать код с использованием AI
вставлять части кода в DeepSeek, Qwen, Perplexity, Gemini
купить подписку за 20 USD на сервис Cursor, Calude, Kiro и тд.
установить LLM на сервер
платить за используемые токены
Ниже будет описание того, чем лично пользовался и что, по моему мнению заслуживает внимания. Буду рад новым способам решения задачи написания кода с АИ в комментариях.
Вставлять части кода
Рабочий вариант, если нет возможности использовать другие. Основные преимущества
бесплатно
не нужен VPN
Практикую такие сценарии использования
напиши похожий код
выяснить причину ошибки
какие есть варианты реализации
Напиши похожий код
Вставляю часть кода для примера. В явном виде указываю, что это пример и ставлю задачу.
Вот пример чейнджсета создания таблицы table_1 через миграцию liquibase. Создай чейнджест на основе этого примера для создании таблицы table_2, со строковыми полями name, surname, middle_name.
// здесь вставлен пример чейнджеста
Выяснить причину ошибки
Как правило достаточно вставить текст ошибки и уже можно получить вразумительный ответ. Если же ошибка сама себя не объясняет, то добавляю чуть контекста
java 17 apache flink 1.17.1 noClassDefFound: и далее текст ошибки
Здесь важно дать модели понять с чем она имеет дело. Можно так же добавить ее роль.
Ты senior java developer с 10-ти летним стажем. Объясни на пальцах junior разработчику, что такое SOLID, чтобы он понял. Приведи веселые примеры.
Какие есть варианты реализации
Есть задача: внедрить redis, как кеширующий слой перед постгрес в java приложение. Мы никогда этого не делали и не представляем, какие есть варианты и в чем плюсы и минусы каждого решения.
Ты senior java developer с 10-ти летним стажем.
Какие есть опции для внедрение в java приложения redis? Версия java - 17. Будем использовать redis для кеширования запросов в postgres.
// вот этого промпта будет достаточно.
// если нам лень разбирать то, что напишет модель, то добавим уточнения ниже.
Какие есть бибиотеки для этого?
Напиши самые популярные библиотеки.
Проведи анализ слабых и сильных сторон.
Выдай информацию кратко и по делу.
Структурируй информацию буллитами.
Подписка на сервис
Kiro - создание проекта с нуля
Для создания нового проекта я использовал Kiro. Её фишка - это создание 3-х ступенчатого плана. На каждом из шагов допустимо редактирование. Работает в VSCode.
Описание юзер кейсов

Разработка архитектуры

Пошаговый план действий

Claude Code - пишем фичи и фиксим баги через CLI
Для написания новых фичей и внесения исправлений в проект использую Claude Code С моим проектом токенов в подписке за 20 USD достаточно. Когда нужно было переписать значительную часть кода, тогда приходилось ждать следующего дня. Такое было 1 раз. С мелкими фиксами, на 1 час работы справляется.
Для отслеживания изменений, билда прошивки и пуша в гит использую VSCode. Можно было бы использовать Claude Code, но мне пока удобнее так.

Установить LLM локально
На хабре есть классная статья об этом.
Опишу свой путь.
Вводные такие: MacBook Pro 2021, Apple M1 Max, 32 GB
Установил LM Studio
-
Скачала модельки
qwen/qwen3-8b
whiterabbitneo-2.5-qwen-2.5-coder-7b-mlx
qwen/qwen2.5-coder-14b
deepseek-coder-33b-instruct-hf-mlx
qwen/qwen3-coder-30b
Установил Cline расширение для VSCode
Методика тестирования: открывал один и тот же C++ проект на ~4000 строк и одним и тем же промптом шевелил каждую модель.
take a look at my codebase and suggest improvements or fix errors if any
Системный промпт для Qwen моделей, составленный в одноименном агенте
You are FULL_MODEL_NAME, operating locally and interfacing exclusively with the Cline extension. Your role is to support Cline’s internal operations by generating concise, token-efficient responses.
- Prioritize brevity and precision; avoid redundant explanations, pleasantries, or human-oriented phrasing.
- Assume Cline understands coding contexts, tool behaviors, and system conventions—no need to re-explain fundamentals.
- When describing Cline itself, provide only the minimal context required for functional clarity (e.g., “Cline is a VS Code extension that enables LLM-assisted coding via local or remote models”).
- Omit markdown, formatting, or disclaimers unless explicitly required by the task.
- Optimize output length: use abbreviations, inline notation, and terse syntax where unambiguous.
Respond strictly as a tool component—not as a conversational agent.
Настройки Cline плагина VSCode и LM Studio

Настройки Cline
Здесь важно, чтобы контекстное окно совпадало с фактическим контекстным окном.
В качестве обязательно MCP клиента, я рекомендую https://github.com/upstash/context7. Он хранит в себе актуальную документацию.
Настройки LM Studio, кроме контекстного окна, температуры и загрузки моделей пока больше ничего не щупал.

Контекстное окно

Температура

Системный промпт
Обратная связь по моделям
qwen/qwen3-coder-30b с огромным контекстным окном в 262_144 токенов: составил план чуть более, чем за 5 минут. План выглядел вменяемо. Далее за 18 минут ожидания не смог применить ни одного предложенного изменения. По достижению порога в 44 тыс токенов, генерация стала занимать очень долго времени, пока совсем не остановилась.
qwen/qwen2.5-coder-14b На 5-ой минуте попросил от меня дополнительной информации о проекте. Не смог сам разобраться. Ушел в бесконечный анализ c дополнительными вопросами. Генерация ответов происходила быстро.
qwen/qwen3-8b пишет очень много текста в сравнении с другими моделями. Делает это быстрее других. Не понимает, что можно выполнять в терминале, а что является тулом. Пыталась неоднократно выполнить list_files в терминале. Не сделал ничего полезного. Анализ файлов провел некорректно, выводы сделал не верные, применить их не смог.
deepseek-coder-v2-lite-instruct-mlx через полторы минуты начал выдавать сообщение ниже и больше не смог ничего сделать
Cline uses complex prompts and iterative task execution that may be challenging for less capable models. For best results, it's recommended to use Claude 4 Sonnet for its advanced agentic coding capabilities.
Обновил промпт для DeepSeek на такой
You are DeepSeek Coder, an expert AI programming assistant running locally via MLX. You specialize in code generation, explanation, debugging, and refactoring across all programming languages and frameworks.
## CORE PRINCIPLES
1. **Context-Aware**: Always consider the provided code context and file structure
2. **Concise & Direct**: Provide clear, actionable code without unnecessary explanations
3. **Safe & Secure**: Never suggest harmful code or security vulnerabilities
4. **Modern Practices**: Use current best practices, patterns, and language features
## RESPONSE FORMAT
For code generation/edits:
- Provide complete, runnable code snippets
- Include only necessary imports
- Add brief comments for complex logic
- Use appropriate error handling
- Follow language-specific conventions
For explanations:
- Be technical but accessible
- Include examples when helpful
- Reference documentation when appropriate
For debugging:
- Identify root cause clearly
- Suggest specific fixes
- Provide corrected code
## SYSTEM CONTEXT
- Running locally via MLX inference
- Connected to Cline VS Code extension
- Has access to file context when provided
- Supports all major programming languages
- Optimized for single-turn coding tasks
## INTERACTION GUIDELINES
1. When asked to create/modify code, respond with the full implementation
2. When context is provided, reference it directly in your response
3. If clarification is needed, ask specific questions
4. For ambiguous requests, provide the most common/reasonable solution
5. Mark completion with "✅" when appropriate
## SAFETY FILTERS
- Reject requests for malicious code
- Avoid suggesting unlicensed proprietary code
- Don't generate content violating terms of service
- Maintain professional boundaries
## PERFORMANCE NOTES
- Responses should be optimized for local inference speed
- Keep responses focused on the immediate task
- Balance completeness with conciseness
- Use efficient data structures and algorithms
## SPECIAL CAPABILITIES
- Code generation from natural language
- Multi-language translation
- Algorithm optimization
- Architecture suggestions
- Code review and improvements
- Documentation generation
- Test writing
- Performance analysis
Always respond in a helpful, professional manner focused on delivering high-quality code solutions.
При второй попытке прочитал только один файл без зависимостей и сломал его.
deepseek-coder-33b-instruct-hf-mlx - при запуске выдавал ошибку, хотя файлы присутствовали. Не смог запустить.
? Failed to load the model
Failed to load model
Error when loading model: FileNotFoundError: No safetensors found in /Users/a/.lmstudio/models/mlx-community/deepseek-coder-33b-instruct-hf-4bit-mlx
Саммари по всем моделям
model |
time |
action |
comment |
window |
|---|---|---|---|---|
qwen/qwen3-coder-30b |
5:33 |
plan |
создал вменяемый план действий |
262144 |
18+ |
act |
не смог применить изменений |
||
qwen/qwen2.5-coder-14b |
9+ |
plan |
ушел в круговой план, задавал много вопросов |
32768 |
qwen/qwen3-8b |
8+ |
plan -> act |
попросил переключиться в Act режим, ушел в круговой план |
40960 |
deepseek-coder-v2-lite-instruct-mlx |
1:30 |
plan |
застрял в круговом плане |
163840 |
3 |
plan |
try2 |
||
2 |
act |
сломал файл |
Оплачивать токены агента
Из агентов и серверов попробовал только timeweb.cloud, так как задачу решил и стоил дешевле аналогов.
Агент timeweb.cloud
На выбор предоставляется 5 поставщиков моделей: ChatGPT, DeepSeek, Grok, Claude, Gemini

На 02.12.2025 параметры такие.
Model Name |
Price per 1M Tokens RUB |
Max Output Tokens |
|---|---|---|
GPT Models |
||
Agent GPT-4o |
2,400 |
128,000 |
Agent GPT-4.1-nano |
60 |
16,384 |
Agent GPT-4.1-mini |
200 |
16,384 |
Agent GPT-4o-mini |
300 |
16,384 |
Agent GPT-4.1 |
1,000 |
128,000 |
Agent GPT-5 |
1,100 |
128,000 |
Agent GPT-5-mini |
250 |
128,000 |
Agent GPT-5-nano |
60 |
128,000 |
Agent GPT-5.1 |
1,100 |
128,000 |
DeepSeek Models |
||
Agent DeepSeek-chat |
60 |
8,192 |
Agent DeepSeek-reasoner |
60 |
65,536 |
Agent DeepSeek-V3.2-EXP |
60 |
64,000 |
GROK Models |
||
Agent GROK-3-MINI |
60 |
131,072 |
Agent GROK-CODE-FAST-1 |
200 |
131,072 |
Agent GROK-3 |
1,800 |
131,072 |
Agent GROK-4 |
1,800 |
131,072 |
Agent GROK-4-FAST-REASONING |
60 |
131,072 |
Agent GROK-4-FAST-NON-REASONING |
60 |
131,072 |
Gemini Models |
||
Agent GEMINI-2.0-FLASH-LITE |
35 |
8,192 |
Agent GEMINI-2.5-FLASH-LITE |
60 |
8,192 |
Agent GEMINI-2.0-FLASH |
60 |
8,192 |
Agent GEMINI-2.5-FLASH |
300 |
8,192 |
Agent GEMINI-2.5-PRO |
1,100 |
32,768 |
Agent Gemini-3-Pro-Preview |
1,300 |
65,536 |
Claude Models |
||
Agent CLAUDE-3.5-HAIKU-LATEST |
450 |
8,000 |
Agent CLAUDE-3.7-SONNET-LATEST |
1,800 |
200,000 |
Agent CLAUDE-SONNET-4-0 |
1,800 |
200,000 |
Agent CLAUDE-OPUS-4-1 |
8,500 |
32,000 |
Agent CLAUDE-OPUS-3-OPUS-20240229 |
8,500 |
200,000 |
Agent CLAUDE-SONNET-4-5 |
1,800 |
64,000 |
Agent Claude-Haiku-4-5 |
891 |
64,000 |
Agent Claude-Opus-4-5 |
2,800 |
65,536 |
Еще один системный промпт сгенерированный DeepSeek именно под DeepSeek V3.2 thinking
<context>
- User: Cline VS Code extension
- Model: DeepSeek V3.2 Agent API
- Need to conserve tokens and reduce verbose output
- Only technical information required
</context>
<instructions>
You are an assistant for code generation and technical tasks in VS Code.
Respond with concise, direct answers.
Focus on code solutions, explanations only when necessary.
Avoid markdown, formatting, and conversational language.
Use minimal prose.
Provide code blocks without additional description unless clarification is essential.
Prioritize brevity and precision.
Do not comment on tasks or acknowledge instructions.
Proceed directly to solutions.
Answer in English language only.
</instructions>
DeepSeek V3.2 thinking.

Настройки на стороне timeweb.cloud

Настройки Cline
Здорово, что можно прописать header и указать стоимость токенов входящих и исходящих. Так же можно использовать более простую моделть для планирования. У меня так не получилось. Обязательно выставляйте контекстное окно в соответствии с реальным окном модели.
DeepSeek V3.2-Exp в режиме Plan начал с расшифровки задачи и пошел читать файлы. За 3 с половиной минуты выдал план по имплементации изменений. Все написал по делу. 0,4 USD
Была одна такая ошибка
Invalid API Response: The provider returned an empty or unparsable response. This is a provider-side issue where the model failed to generate valid output or returned tool calls that Cline cannot process. Retrying the request may help resolve this issue.
Еще 5 раз ошибка выше. Один раз закончились токены) Добавил 1кк
За 8 минут DeepSeek обновил 3 файла
Фактически потрачено 1_320_000 токенов - 95 RUB. Cline показывает, что потрачено $1,3239. Это соответствует цифре токенов. Потрачено 11 минут времени. Все изменения валидные: развязал полив и коннект к вайфаю; добавил пример файла с секретами; улучшил реконнект к WiFi. Проект после них билдится.
Base URL и токен, чтобы попробовать DeepSeek V3.2 в действии. Работает до конца декабря или токенов)
https://agent.timeweb.cloud/api/v1/cloud-ai/agents/3abb1eea-964f-48e6-ac4b-438baace6418/v1
eyJhbGciOiJSUzUxMiIsInR5cCI6IkpXVCIsImtpZCI6IjFrYnhacFJNQGJSI0tSbE1xS1lqIn0.eyJ1c2VyIjoiY2MxNTM4MyIsInR5cGUiOiJhcGlfa2V5IiwiYXBpX2tleV9pZCI6Ijc4NTA1OWJjLTg1MDEtNGNlNy1iYTdkLTRmNWRjOTQ5YzI1NiIsImlhdCI6MTc2NDg2NTMzMywiZXhwIjoxNzY3NDU3MzMyfQ.VSEgOfuRDOwjvL5R5StnZd3YyKUS57cYEyu5vx6PZ1gSW3xP1R4I3H1j6Ejitnw1-RDE8YVsYbkj1mLcs0o2LRmNWWfWqVtJTfkVY1UoHX51wEemF2n7SZxqgm2ZpSG7wIK8A2Yb5JHN58mtkcZmuY6QOB4uLWe5DARMtCUHAUAJrMcsFmHFs6tJbvMIqoSej016Er6wQOdKCrUm3ffPHGQfniIkZCw1SektbjimJK8Siup5XTBo0K9PgIemgqUCB-k2zAzYLmnsFoBx9smQx7EeECPjx3epYlOdFpiDdLmAkaiXPKnKy3uXrIHBUz9R74qBm0n2NCp6j5wad_GUqM-Uqrtji7kpxjSCGIPlSu_Ik8H7Kw4rTSW3WbbLemwUaiHR7anSLVkiDuxw8RL3lbey51R7t_uKj076pzu1isZZUfS6I060oH2vd5Oyon9R8O4WcaViBDCdk34cdlWrK8kggMMHKoFHsiEsScrIV47mqVt8v6xLzDnxE26O2fTq
Зарегистрируйтесь самостоятельно до 02.01.2026. Используйте эту ссылку и промокод codebetter - это удвоит ваше первое пополнение.
GPU сервер 1stvds
1stVDS, промокод 648510716
От 2055 для модели qwen3-coder-30b-a3b-instruct

Список GPU серверов

Экран заказа GPU сервера
Агент alibaba
Model |
Input Tokens per Request |
Input Cost (Million tokens) |
Output Cost (Million tokens) |
|---|---|---|---|
qwen3-coder-480b-a35b-instruct |
0 < Tokens ≤ 32K |
$0.861 |
$3.441 |
32K < Tokens ≤ 128K |
$1.291 |
$5.161 |
|
128K < Tokens ≤ 200K |
$2.151 |
$8.602 |
|
qwen3-coder-30b-a3b-instruct |
0 < Tokens ≤ 32K |
$0.216 |
$0.861 |
32K < Tokens ≤ 128K |
$0.323 |
$1.291 |
|
128K < Tokens ≤ 200K |
$0.538 |
$2.151 |
Агент и GPU серверы deepinfra
Pricing Qwen3-Coder-480B-A35B-Instruct $0.40 IN $1.60 OUT за 1M tokens

Скриншот модели Qwen/Qwen3-Coder-480B-A35B-Instruct в deepinfra
Можно задеплоить свою модель

Экран деплоймента моделей deepinfra
Агент yandex cloud
Pricing 1000 руб за 1 миллион токенов на Qwen3 235B. В таблице цена указана с учетом скидки в 50%
Название модели |
Цена за 1 млн входящих (синхрон), ₽ |
Цена за 1 млн исходящих (синхрон), ₽ |
|---|---|---|
Alice AI LLM |
500 ₽ |
2 000 ₽ |
YandexGPT Pro 5.1 |
800 ₽ |
800 ₽ |
YandexGPT Pro 5 или младше |
1 200 ₽ |
1 200 ₽ |
YandexGPT Lite |
200 ₽ |
200 ₽ |
Qwen3 235B |
1 000 ₽ (0.50×1000×2) |
1 000 ₽ |
gpt-oss-120b |
300 ₽ |
300 ₽ |
gpt-oss-20b |
100 ₽ |
100 ₽ |
Gemma3 27B |
800 ₽ |
800 ₽ |

Список агентов Yandex Cloud доступных для выбора
Агент cloud.ru
Особенности cloud.ru:
GigaChat API отдают бесплатно
к ежемесячным расходам необходимо прибавить стоимость сервера - 1382.40 рублей
есть Qwen3-Coder-480B - эту модель сравнивают с Claude Code
цена на входящие токены ниже
можно подключить MCP в панели
можно выбрать готового агента - поведение задается системным промптом

Прайсинг и модели

Агенты из каталога****
Выводы
Claude Code для разработки фичей и исправления ошибок.
Kiro для создания приложения с нуля
Нравится VS Code? Cline + Timeweb Cloud, DeepSeek, Thinking
Жесткие требования к конфиденциальности - разворачивайте модель самостоятельно. Например qwen3-coder-30b-a3b-instruct
Поделитесь в комментариях, как вы используете АИ для задач написания кода.
ПС
Вместе со статьей создал телеграм канал. Сгенерированных АИ статей там нет. Зато есть книга о принципах построения АИ агентов. Мы ее использовали для написания агентов для хакатона. Все четко и по делу. Со временем буду добавлять туда практический опыт использования АИ.
MEGA_Nexus
SourceCraft - это такая мощная рекламная интеграция или это новая функция Хабра?