Вступление

В этой статье я покажу, как всего за 30 минут подключить автоматическое AI-ревью кода в вашем проекте — бесплатно, без токенов, без OpenAI и полностью локально.

В основе решения — три компонента: Ollama, AI Review и GitHub Actions. Ollama отвечает за запуск локальной LLM прямо внутри CI/CD без интернета и внешних API. AI Review — опенсорсный инструмент, который анализирует изменения в Pull Request и оставляет комментарии прямо в GitHub. GitHub Actions обеспечивает автоматический запуск ревью при каждом изменении кода.

Система работает полностью изолированно: код никогда не покидает репозиторий, данные не отправляются во внешние сервисы (OpenAI, Claude, Gemini), а результат формируется локальной моделью в виде inline-комментариев и summary-отчёта.

Иными словами, вы получаете тот же уровень «умного ревью», что и в облачных решениях, но без платы, VPN и рисков для безопасности. В качестве LLM мы будем использовать Ollama, а анализ кода выполнит AI Review, о котором я подробно рассказывал в предыдущей статье. Тот же подход можно адаптировать под GitLab, Bitbucket или Jenkins — всё кроссплатформенно и не привязано к конкретному CI.

Что такое Ollama и зачем она нужна?

Когда речь заходит об AI-ревью, первый вопрос — на какой LLM оно будет работать. Обычно разработчики вспоминают OpenAI, Claude или Gemini. Но у таких решений есть три очевидных минуса: они стоят денег, недоступны в ряде стран (РФ, РБ), и требуют отправки кода во внешние сервисы.

Теперь представьте, что ту же модель можно запустить прямо внутри CI/CD — без токенов, VPN и передачи данных наружу. Вот здесь и появляется Ollama. Это не альтернатива OpenAI, а удобный локальный адаптер, позволяющий разворачивать модели вроде llama3, phi3, mistral, codellama и других в один Docker-контейнер и обращаться к ним через HTTP API.

Для AI Review это идеальное решение: инструмент не зависит от конкретного провайдера, поддерживает любую модель — от «тяжёлых» GPT-уровня до лёгких локальных — и при необходимости легко переключается на свой LLM endpoint.

Хотите локально — ставьте Ollama, нужно в облаке — подключайте OpenAI, Claude или собственный inference-сервер. AI Review универсален по дизайну и одинаково хорошо работает в CI, на сервере или в корпоративной сети без выхода в интернет.

Настраиваем AI Review

Чтобы запустить ревью, достаточно минимального конфига. AI Review из коробки поддерживает GitHub и умеет анализировать Pull Request без дополнительной настройки. Всё сводится к нескольким строкам YAML — можно просто положить файл в корень проекта.

Создаём .ai-review.yaml:

# Используем локальную LLM через Ollama
llm:
  provider: OLLAMA
  meta:
    model: mistral          # модель, которую будет использовать ревью
    max_tokens: 2048        # ограничение на размер ответа
    temperature: 0.2        # чем ниже, тем строже ответы
  http_client:
    api_url: http://localhost:11434  # локальный endpoint Ollama
    timeout: 600                     # запас по времени для генерации

# Подключаемся к GitHub для получения PR и публикации комментариев
vcs:
  provider: GITHUB
  http_client:
    api_url: https://api.github.com
    timeout: 120

И всё — AI Review подключится к локальной модели через Ollama и начнёт анализировать изменения в вашем PR.

Если хотите добавить собственные промпты, изменить стиль комментариев, ограничить количество замечаний или исключить файлы из анализа — всё это настраивается в расширенном конфиге. Подробности — в документации AI Review.

Настраиваем GitHub Actions

Теперь добавим пайплайн, который будет запускать ревью в CI/CD. Всё просто: создаём файл .github/workflows/ai-review.yml. Он поднимает Ollama, скачивает модель, прогревает её и запускает AI Review.

Для других CI (GitLab, Bitbucket, Jenkins) всё аналогично — нужно лишь поднять контейнер Ollama и вызвать CLI-команду ai-review run.

Создаём .github/workflows/ai-review.yml:

name: ? AI Review

on:
  # Ручной запуск пайплайна (можно заменить на on: pull_request)
  workflow_dispatch:
    inputs:
      review-command:
        type: choice
        default: "run"
        options: [ run, run-inline, run-context, run-summary ]
        description: "Какой тип ревью запустить"

      pull-request-number:
        type: string
        required: true
        description: "Номер Pull Request"

jobs:
  ai-review:
    name: Run AI Review
    runs-on: ubuntu-latest

    # Поднимаем локальную LLM Ollama в фоне
    services:
      ollama:
        image: ollama/ollama:latest
        ports: [ 11434:11434 ]

    steps:
      # 1️⃣ Клонируем репозиторий
      - name: ? Checkout repository
        uses: actions/checkout@v4
        with:
          fetch-depth: 0  # нужно, чтобы видеть diff в PR

      # 2️⃣ Ждём, пока Ollama поднимется
      - name: ⏳ Wait for Ollama to start
        run: |
          echo "⏳ Ожидаем запуск Ollama..."
          for i in $(seq 1 30); do
            if curl -s http://localhost:11434/api/version; then
              echo "✅ Ollama готова!"
              break
            fi
            sleep 3
          done

      # 3️⃣ Скачиваем выбранную модель (в примере — mistral)
      - name: ? Pull model
        run: |
          echo "? Загружаем модель 'mistral'..."
          curl -X POST http://localhost:11434/api/pull \
            -H "Content-Type: application/json" \
            -d '{"model": "mistral"}'

      # 4️⃣ Прогреваем модель (чтобы первый запрос не был долгим)
      - name: ? Warm up model
        run: |
          echo "? Прогреваем модель..."
          curl -s -X POST http://localhost:11434/api/chat \
            -H "Content-Type: application/json" \
            -d '{"model":"mistral","stream":false,"messages":[{"role":"user","content":"Hello!"}]}'
          echo "✅ Warm-up complete."

      # 5️⃣ Запускаем ревью
      - name: ? Run AI Review
        # Укажите актуальную версию инструмента
        uses: Nikita-Filonov/ai-review@v0.27.0
        env:
          # GitHub токен для доступа к PR
          VCS__HTTP_CLIENT__API_TOKEN: ${{ secrets.GITHUB_TOKEN }}

          # Контекст PR (репозиторий и номер)
          VCS__PIPELINE__OWNER: ${{ github.repository_owner }}
          VCS__PIPELINE__REPO: ${{ github.event.repository.name }}
          VCS__PIPELINE__PULL_NUMBER: ${{ inputs.pull-request-number }}

        with:
          # Тип запускаемого ревью: полный, только inline или summary
          review-command: ${{ inputs.review-command }}

Если вы используете GitLab CI, Jenkins или Bitbucket Pipelines — просто повторите те же шаги: запустите Ollama в контейнере, скачайте модель и вызовите CLI-команду ai-review run с нужными переменными окружения.

Результат

После настройки всего пайплайна можно запустить ревью вручную — достаточно выбрать команду (run, run-inline, run-context, run-summary) и указать номер Pull Request. Это делается прямо из вкладки Actions → AI Review → Run workflow:

После старта GitHub Actions поднимает контейнер с Ollama, скачивает выбранную модель (в нашем примере — mistral), прогревает её и запускает AI Review. В логах можно видеть все шаги пайплайна — от инициализации контейнера до публикации комментариев:

Через пару минут в самом Pull Request появятся комментарии от GitHub Actions:

Inline-комментарии — конкретные замечания по строкам кода:

Summary-комментарий — общий обзор изменений и рекомендации:

Важно: чтобы бот мог публиковать комментарии, убедитесь, что GITHUB_TOKEN имеет права read + write для Pull Request. Это можно включить в настройках репозитория или явно указать в workflow.

Есть нюанс

Нужно понимать: Ollama — это не облачный OpenAI, и на CI/CD с ограниченными ресурсами она может работать заметно медленнее. Скорость генерации напрямую зависит от самой модели, длины промптов и количества токенов в ответе.

В базовой конфигурации из статьи ревью может занимать от 1 до 3 минут на файл, и это нормально для локального запуска без GPU. Если хочется ближе к облачному опыту — просто перенесите Ollama на:

  • отдельный self-hosted runner с выделенными ресурсами;

  • или облачную виртуалку (4+ CPU, 8+ GB RAM — минимально комфортно);

  • или GPU-инстанс, если используете крупные модели вроде llama3 или codellama.

Важно понимать: AI Review не тормозит сам по себе — его скорость полностью зависит от LLM-провайдера, к которому вы подключены. Сегодня это Ollama, завтра может быть OpenAI, Claude, Gemini или даже ваш внутренний inference-сервер. Интерфейс и логика работы останутся теми же.

Главная идея — гибкость и автономность, а не “чудо за бесплатно”. Этот пример показывает, что можно построить AI Review, не отдавая код вовне и не платя за токены. А вот как быстро и на какой модели — зависит уже от выбранного стека и ваших ресурсов.

Заключение

В итоге мы получили полноценный AI code review, работающий прямо в CI/CD — без токенов, без внешних API и без копейки затрат. AI Review анализирует Pull Request, оставляет inline-комментарии, формирует summary — и всё это происходит внутри вашей инфраструктуры, без передачи кода наружу.

По сути, всё, что нужно — это Docker, GitHub Actions и минимальный конфиг. Дальше вы сами решаете, как масштабировать решение: оставить базовый сценарий на GitHub или развернуть Ollama на self-hosted runner или облачном сервере с подходящими ресурсами.

Важно понимать: в мире, где OpenAI, Claude или Gemini стоят денег, требуют VPN и не всегда доступны, локальные решения — это не компромисс, а альтернатива. Они дают ту же пользу — помогают команде писать чище, быстрее и увереннее — но делают это безопасно и доступно каждому.

При этом решение не требует токенов, VPN или внешних зависимостей — всё можно запустить локально, в изолированной среде. А если в будущем появится необходимость — вы всегда сможете подключить другую LLM, будь то OpenAI, Claude, Gemini или собственный корпоративный inference-сервер.

Полезные ссылки и демо

Чтобы не тратить время на поиски — вот всё, что нужно для повторения примера и вдохновения:

Если статья оказалась полезной — поставьте звёздочку репозиторию AI Review на GitHub. Это поможет проекту развиваться и оставаться полностью бесплатным и опенсорсным.

Комментарии (1)


  1. perpoint
    06.10.2025 08:04

    Спасибо за статью, подскажите как можно локализировать комментарии в pr