Способы написания кода с АИ

Принципиально есть несколько способов писать код с использованием AI

  • вставлять части кода в DeepSeek, Qwen, Perplexity, Gemini

  • купить подписку за 20 USD на сервис Cursor, Calude, Kiro и тд.

  • установить LLM на сервер

  • платить за используемые токены

Ниже будет описание того, чем лично пользовался и что, по моему мнению заслуживает внимания. Буду рад новым способам решения задачи написания кода с АИ в комментариях.

Вставлять части кода

Рабочий вариант, если нет возможности использовать другие. Основные преимущества

  • бесплатно

  • не нужен VPN

Практикую такие сценарии использования

  • напиши похожий код

  • выяснить причину ошибки

  • какие есть варианты реализации

Напиши похожий код

Вставляю часть кода для примера. В явном виде указываю, что это пример и ставлю задачу.

Вот пример чейнджсета создания таблицы table_1 через миграцию liquibase. Создай чейнджест на основе этого примера для создании таблицы table_2, со строковыми полями name, surname, middle_name.

// здесь вставлен пример чейнджеста

Выяснить причину ошибки

Как правило достаточно вставить текст ошибки и уже можно получить вразумительный ответ. Если же ошибка сама себя не объясняет, то добавляю чуть контекста

java 17 apache flink 1.17.1 noClassDefFound: и далее текст ошибки

Здесь важно дать модели понять с чем она имеет дело. Можно так же добавить ее роль.

Ты senior java developer с 10-ти летним стажем. Объясни на пальцах junior разработчику, что такое SOLID, чтобы он понял. Приведи веселые примеры.

Какие есть варианты реализации

Есть задача: внедрить redis, как кеширующий слой перед постгрес в java приложение. Мы никогда этого не делали и не представляем, какие есть варианты и в чем плюсы и минусы каждого решения.

Ты senior java developer с 10-ти летним стажем. 

Какие есть опции для внедрение в java приложения redis? Версия java - 17. Будем использовать redis для кеширования запросов в postgres. 

// вот этого промпта будет достаточно. 
// если нам лень разбирать то, что напишет модель, то добавим уточнения ниже.

Какие есть бибиотеки для этого?

Напиши самые популярные библиотеки.
Проведи анализ слабых и сильных сторон.
Выдай информацию кратко и по делу.
Структурируй информацию буллитами.

Подписка на сервис

Kiro - создание проекта с нуля

Для создания нового проекта я использовал Kiro. Её фишка - это создание 3-х ступенчатого плана. На каждом из шагов допустимо редактирование. Работает в VSCode.

Описание юзер кейсов

Разработка архитектуры

Пошаговый план действий

Claude Code - пишем фичи и фиксим баги через CLI

Для написания новых фичей и внесения исправлений в проект использую Claude Code С моим проектом токенов в подписке за 20 USD достаточно. Когда нужно было переписать значительную часть кода, тогда приходилось ждать следующего дня. Такое было 1 раз. С мелкими фиксами, на 1 час работы справляется.

Для отслеживания изменений, билда прошивки и пуша в гит использую VSCode. Можно было бы использовать Claude Code, но мне пока удобнее так.

Установить LLM локально

На хабре есть классная статья об этом.

Опишу свой путь.

Вводные такие: MacBook Pro 2021, Apple M1 Max, 32 GB

  • Установил LM Studio

  • Скачала модельки

    • qwen/qwen3-8b

    • whiterabbitneo-2.5-qwen-2.5-coder-7b-mlx

    • qwen/qwen2.5-coder-14b

    • deepseek-coder-33b-instruct-hf-mlx

    • qwen/qwen3-coder-30b

  • Установил Cline расширение для VSCode

Методика тестирования: открывал один и тот же C++ проект на ~4000 строк и одним и тем же промптом шевелил каждую модель.

take a look at my codebase and suggest improvements or fix errors if any

Системный промпт для Qwen моделей, составленный в одноименном агенте

You are FULL_MODEL_NAME, operating locally and interfacing exclusively with the Cline extension. Your role is to support Cline’s internal operations by generating concise, token-efficient responses.  

- Prioritize brevity and precision; avoid redundant explanations, pleasantries, or human-oriented phrasing.  
- Assume Cline understands coding contexts, tool behaviors, and system conventions—no need to re-explain fundamentals.  
- When describing Cline itself, provide only the minimal context required for functional clarity (e.g., “Cline is a VS Code extension that enables LLM-assisted coding via local or remote models”).  
- Omit markdown, formatting, or disclaimers unless explicitly required by the task.  
- Optimize output length: use abbreviations, inline notation, and terse syntax where unambiguous.  

Respond strictly as a tool component—not as a conversational agent.

Настройки Cline плагина VSCode и LM Studio

Настройки Cline

Здесь важно, чтобы контекстное окно совпадало с фактическим контекстным окном.

В качестве обязательно MCP клиента, я рекомендую https://github.com/upstash/context7. Он хранит в себе актуальную документацию.

Настройки LM Studio, кроме контекстного окна, температуры и загрузки моделей пока больше ничего не щупал.

Контекстное окно

Температура

Системный промпт

Обратная связь по моделям

qwen/qwen3-coder-30b с огромным контекстным окном в 262_144 токенов: составил план чуть более, чем за 5 минут. План выглядел вменяемо. Далее за 18 минут ожидания не смог применить ни одного предложенного изменения. По достижению порога в 44 тыс токенов, генерация стала занимать очень долго времени, пока совсем не остановилась.

qwen/qwen2.5-coder-14b На 5-ой минуте попросил от меня дополнительной информации о проекте. Не смог сам разобраться. Ушел в бесконечный анализ c дополнительными вопросами. Генерация ответов происходила быстро.

qwen/qwen3-8b пишет очень много текста в сравнении с другими моделями. Делает это быстрее других. Не понимает, что можно выполнять в терминале, а что является тулом. Пыталась неоднократно выполнить list_files в терминале. Не сделал ничего полезного. Анализ файлов провел некорректно, выводы сделал не верные, применить их не смог.

deepseek-coder-v2-lite-instruct-mlx через полторы минуты начал выдавать сообщение ниже и больше не смог ничего сделать

Cline uses complex prompts and iterative task execution that may be challenging for less capable models. For best results, it's recommended to use Claude 4 Sonnet for its advanced agentic coding capabilities.

Обновил промпт для DeepSeek на такой

You are DeepSeek Coder, an expert AI programming assistant running locally via MLX. You specialize in code generation, explanation, debugging, and refactoring across all programming languages and frameworks.

## CORE PRINCIPLES
1. **Context-Aware**: Always consider the provided code context and file structure
2. **Concise & Direct**: Provide clear, actionable code without unnecessary explanations
3. **Safe & Secure**: Never suggest harmful code or security vulnerabilities
4. **Modern Practices**: Use current best practices, patterns, and language features

## RESPONSE FORMAT
For code generation/edits:
- Provide complete, runnable code snippets
- Include only necessary imports
- Add brief comments for complex logic
- Use appropriate error handling
- Follow language-specific conventions

For explanations:
- Be technical but accessible
- Include examples when helpful
- Reference documentation when appropriate

For debugging:
- Identify root cause clearly
- Suggest specific fixes
- Provide corrected code

## SYSTEM CONTEXT
- Running locally via MLX inference
- Connected to Cline VS Code extension
- Has access to file context when provided
- Supports all major programming languages
- Optimized for single-turn coding tasks

## INTERACTION GUIDELINES
1. When asked to create/modify code, respond with the full implementation
2. When context is provided, reference it directly in your response
3. If clarification is needed, ask specific questions
4. For ambiguous requests, provide the most common/reasonable solution
5. Mark completion with "✅" when appropriate

## SAFETY FILTERS
- Reject requests for malicious code
- Avoid suggesting unlicensed proprietary code
- Don't generate content violating terms of service
- Maintain professional boundaries

## PERFORMANCE NOTES
- Responses should be optimized for local inference speed
- Keep responses focused on the immediate task
- Balance completeness with conciseness
- Use efficient data structures and algorithms

## SPECIAL CAPABILITIES
- Code generation from natural language
- Multi-language translation
- Algorithm optimization
- Architecture suggestions
- Code review and improvements
- Documentation generation
- Test writing
- Performance analysis

Always respond in a helpful, professional manner focused on delivering high-quality code solutions.

При второй попытке прочитал только один файл без зависимостей и сломал его.

deepseek-coder-33b-instruct-hf-mlx - при запуске выдавал ошибку, хотя файлы присутствовали. Не смог запустить.

? Failed to load the model

Failed to load model

Error when loading model: FileNotFoundError: No safetensors found in /Users/a/.lmstudio/models/mlx-community/deepseek-coder-33b-instruct-hf-4bit-mlx

Саммари по всем моделям

model

time

action

comment

window

qwen/qwen3-coder-30b

5:33

plan

создал вменяемый план действий

262144

18+

act

не смог применить изменений

qwen/qwen2.5-coder-14b

9+

plan

ушел в круговой план, задавал много вопросов

32768

qwen/qwen3-8b

8+

plan -> act

попросил переключиться в Act режим, ушел в круговой план

40960

deepseek-coder-v2-lite-instruct-mlx

1:30

plan

застрял в круговом плане

163840

3

plan

try2

2

act

сломал файл

Оплачивать токены агента

Из агентов и серверов попробовал только timeweb.cloud, так как задачу решил и стоил дешевле аналогов.

Агент timeweb.cloud

На выбор предоставляется 5 поставщиков моделей: ChatGPT, DeepSeek, Grok, Claude, Gemini

На 02.12.2025 параметры такие.

Model Name

Price per 1M Tokens RUB

Max Output Tokens

GPT Models

Agent GPT-4o

2,400

128,000

Agent GPT-4.1-nano

60

16,384

Agent GPT-4.1-mini

200

16,384

Agent GPT-4o-mini

300

16,384

Agent GPT-4.1

1,000

128,000

Agent GPT-5

1,100

128,000

Agent GPT-5-mini

250

128,000

Agent GPT-5-nano

60

128,000

Agent GPT-5.1

1,100

128,000

DeepSeek Models

Agent DeepSeek-chat

60

8,192

Agent DeepSeek-reasoner

60

65,536

Agent DeepSeek-V3.2-EXP

60

64,000

GROK Models

Agent GROK-3-MINI

60

131,072

Agent GROK-CODE-FAST-1

200

131,072

Agent GROK-3

1,800

131,072

Agent GROK-4

1,800

131,072

Agent GROK-4-FAST-REASONING

60

131,072

Agent GROK-4-FAST-NON-REASONING

60

131,072

Gemini Models

Agent GEMINI-2.0-FLASH-LITE

35

8,192

Agent GEMINI-2.5-FLASH-LITE

60

8,192

Agent GEMINI-2.0-FLASH

60

8,192

Agent GEMINI-2.5-FLASH

300

8,192

Agent GEMINI-2.5-PRO

1,100

32,768

Agent Gemini-3-Pro-Preview

1,300

65,536

Claude Models

Agent CLAUDE-3.5-HAIKU-LATEST

450

8,000

Agent CLAUDE-3.7-SONNET-LATEST

1,800

200,000

Agent CLAUDE-SONNET-4-0

1,800

200,000

Agent CLAUDE-OPUS-4-1

8,500

32,000

Agent CLAUDE-OPUS-3-OPUS-20240229

8,500

200,000

Agent CLAUDE-SONNET-4-5

1,800

64,000

Agent Claude-Haiku-4-5

891

64,000

Agent Claude-Opus-4-5

2,800

65,536

Еще один системный промпт сгенерированный DeepSeek именно под DeepSeek V3.2 thinking

<context>
- User: Cline VS Code extension
- Model: DeepSeek V3.2 Agent API
- Need to conserve tokens and reduce verbose output
- Only technical information required
</context>

<instructions>
You are an assistant for code generation and technical tasks in VS Code. 
Respond with concise, direct answers. 
Focus on code solutions, explanations only when necessary. 
Avoid markdown, formatting, and conversational language. 
Use minimal prose. 
Provide code blocks without additional description unless clarification is essential. 
Prioritize brevity and precision. 
Do not comment on tasks or acknowledge instructions. 
Proceed directly to solutions.
Answer in English language only.
</instructions>

DeepSeek V3.2 thinking.

Настройки на стороне timeweb.cloud

Настройки Cline

Здорово, что можно прописать header и указать стоимость токенов входящих и исходящих. Так же можно использовать более простую моделть для планирования. У меня так не получилось. Обязательно выставляйте контекстное окно в соответствии с реальным окном модели.

DeepSeek V3.2-Exp в режиме Plan начал с расшифровки задачи и пошел читать файлы. За 3 с половиной минуты выдал план по имплементации изменений. Все написал по делу. 0,4 USD

Была одна такая ошибка

Invalid API Response: The provider returned an empty or unparsable response. This is a provider-side issue where the model failed to generate valid output or returned tool calls that Cline cannot process. Retrying the request may help resolve this issue.

Еще 5 раз ошибка выше. Один раз закончились токены) Добавил 1кк

За 8 минут DeepSeek обновил 3 файла

Фактически потрачено 1_320_000 токенов - 95 RUB. Cline показывает, что потрачено $1,3239. Это соответствует цифре токенов. Потрачено 11 минут времени. Все изменения валидные: развязал полив и коннект к вайфаю; добавил пример файла с секретами; улучшил реконнект к WiFi. Проект после них билдится.

Base URL и токен, чтобы попробовать DeepSeek V3.2 в действии. Работает до конца декабря или токенов)

https://agent.timeweb.cloud/api/v1/cloud-ai/agents/3abb1eea-964f-48e6-ac4b-438baace6418/v1

eyJhbGciOiJSUzUxMiIsInR5cCI6IkpXVCIsImtpZCI6IjFrYnhacFJNQGJSI0tSbE1xS1lqIn0.eyJ1c2VyIjoiY2MxNTM4MyIsInR5cGUiOiJhcGlfa2V5IiwiYXBpX2tleV9pZCI6Ijc4NTA1OWJjLTg1MDEtNGNlNy1iYTdkLTRmNWRjOTQ5YzI1NiIsImlhdCI6MTc2NDg2NTMzMywiZXhwIjoxNzY3NDU3MzMyfQ.VSEgOfuRDOwjvL5R5StnZd3YyKUS57cYEyu5vx6PZ1gSW3xP1R4I3H1j6Ejitnw1-RDE8YVsYbkj1mLcs0o2LRmNWWfWqVtJTfkVY1UoHX51wEemF2n7SZxqgm2ZpSG7wIK8A2Yb5JHN58mtkcZmuY6QOB4uLWe5DARMtCUHAUAJrMcsFmHFs6tJbvMIqoSej016Er6wQOdKCrUm3ffPHGQfniIkZCw1SektbjimJK8Siup5XTBo0K9PgIemgqUCB-k2zAzYLmnsFoBx9smQx7EeECPjx3epYlOdFpiDdLmAkaiXPKnKy3uXrIHBUz9R74qBm0n2NCp6j5wad_GUqM-Uqrtji7kpxjSCGIPlSu_Ik8H7Kw4rTSW3WbbLemwUaiHR7anSLVkiDuxw8RL3lbey51R7t_uKj076pzu1isZZUfS6I060oH2vd5Oyon9R8O4WcaViBDCdk34cdlWrK8kggMMHKoFHsiEsScrIV47mqVt8v6xLzDnxE26O2fTq

Зарегистрируйтесь самостоятельно до 02.01.2026. Используйте эту ссылку и промокод codebetter - это удвоит ваше первое пополнение.

GPU сервер 1stvds

1stVDS, промокод 648510716

От 2055 для модели qwen3-coder-30b-a3b-instruct

Список GPU серверов

Экран заказа GPU сервера

Агент alibaba

Pricing

Model

Input Tokens per Request

Input Cost (Million tokens)

Output Cost (Million tokens)

qwen3-coder-480b-a35b-instruct

0 < Tokens ≤ 32K

$0.861

$3.441

32K < Tokens ≤ 128K

$1.291

$5.161

128K < Tokens ≤ 200K

$2.151

$8.602

qwen3-coder-30b-a3b-instruct

0 < Tokens ≤ 32K

$0.216

$0.861

32K < Tokens ≤ 128K

$0.323

$1.291

128K < Tokens ≤ 200K

$0.538

$2.151

Агент и GPU серверы deepinfra

Pricing Qwen3-Coder-480B-A35B-Instruct $0.40 IN $1.60 OUT за 1M tokens

Скриншот модели Qwen/Qwen3-Coder-480B-A35B-Instruct в deepinfra

Можно задеплоить свою модель

Экран деплоймента моделей deepinfra

Агент yandex cloud

Pricing 1000 руб за 1 миллион токенов на Qwen3 235B. В таблице цена указана с учетом скидки в 50%

Название модели

Цена за 1 млн входящих (синхрон), ₽

Цена за 1 млн исходящих (синхрон), ₽

Alice AI LLM

500 ₽

2 000 ₽

YandexGPT Pro 5.1

800 ₽

800 ₽

YandexGPT Pro 5 или младше

1 200 ₽

1 200 ₽

YandexGPT Lite

200 ₽

200 ₽

Qwen3 235B

1 000 ₽ (0.50×1000×2)

1 000 ₽

gpt-oss-120b

300 ₽

300 ₽

gpt-oss-20b

100 ₽

100 ₽

Gemma3 27B

800 ₽

800 ₽

Список агентов Yandex Cloud доступных для выбора

Агент cloud.ru

Особенности cloud.ru:

  • GigaChat API отдают бесплатно

  • к ежемесячным расходам необходимо прибавить стоимость сервера - 1382.40 рублей

  • есть Qwen3-Coder-480B - эту модель сравнивают с Claude Code

  • цена на входящие токены ниже

  • можно подключить MCP в панели

  • можно выбрать готового агента - поведение задается системным промптом

Прайсинг и модели

Агенты из каталога****

Выводы

  1. Claude Code для разработки фичей и исправления ошибок.

  2. Kiro для создания приложения с нуля

  3. Нравится VS Code? Cline + Timeweb Cloud, DeepSeek, Thinking

  4. Жесткие требования к конфиденциальности - разворачивайте модель самостоятельно. Например qwen3-coder-30b-a3b-instruct

Поделитесь в комментариях, как вы используете АИ для задач написания кода.

ПС
Вместе со статьей создал телеграм канал. Сгенерированных АИ статей там нет. Зато есть книга о принципах построения АИ агентов. Мы ее использовали для написания агентов для хакатона. Все четко и по делу. Со временем буду добавлять туда практический опыт использования АИ.

Комментарии (1)


  1. MEGA_Nexus
    04.12.2025 17:36

    SourceCraft - это такая мощная рекламная интеграция или это новая функция Хабра?