Команда AI for Devs подготовила перевод анонса Grok 4 Fast — новой модели xAI, которая сочетает быстрые ответы и глубокие рассуждения, снижает стоимость токенов на 98% и впервые становится доступной всем пользователям без ограничений.


Мы рады представить Grok 4 Fast — шаг вперёд в создании моделей для экономичного рассуждения. Построенная на опыте xAI с Grok 4, Grok 4 Fast обеспечивает производительность уровня передовых решений как для бизнеса, так и для конечных пользователей — при выдающейся эффективности по числу токенов. Эта модель раздвигает границы для компактных и быстрых ИИ, делая качественные рассуждения доступными большему числу пользователей и разработчиков. Grok 4 Fast предлагает передовую экономичность (SOTA), современные возможности поиска в интернете и X, контекстное окно на 2 миллиона токенов и единую архитектуру, объединяющую режимы рассуждений и прямого ответа в одной модели.

Новый уровень доступного интеллекта

Grok 4 Fast открывает новую страницу в создании доступных по стоимости систем искусственного интеллекта, опережая Grok 3 Mini на тестах на рассуждение и значительно снижая затраты на токены.

Benchmark pass@1

Grok 4 Fast

Grok 4

Grok 3 Mini (High)

GPT-5 (High)

GPT-5 Mini (High)

GPQA Diamond

85.7%

87.5%

79.0%

85.7%

82.3%

AIME 2025 (без инструментов)

92.0%

91.7%

83.0%

94.6%

91.1%

HMMT 2025 (без инструментов)

93.3%

90.0%

74.0%

93.3%

87.8%

HLE (без инструментов)

20.0%

25.4%

11.0%

24.8%

16.7%

LiveCodeBench (янв-май)

80.0%

79.0%

70.0%

86.8%

77.4%

Мы использовали масштабное обучение с подкреплением (reinforcement learning), чтобы максимально повысить «плотность интеллекта» Grok 4 Fast. В наших тестах модель показала результаты, сопоставимые с Grok 4, при этом в среднем используя на 40% меньше thinking-токенов.

Эта 40%-ная прибавка к эффективности по токенам в сочетании с заметно более низкой ценой за токен позволяет сократить стоимость достижения того же уровня на передовых бенчмарках на 98% по сравнению с Grok 4. Независимый обзор от Artificial Analysis подтвердил, что Grok 4 Fast демонстрирует лучший в своём классе показатель соотношения «цена-интеллект» среди всех публично доступных моделей на Artificial Analysis Intelligence Index.

Нативная работа с инструментами и передовой поиск

Grok 4 Fast обучался по схеме end-to-end с использованием обучения с подкреплением (RL), специально ориентированного на работу с инструментами. Он отлично справляется с задачей выбора момента, когда нужно вызвать инструмент — например, выполнить код или открыть браузер.

Grok 4 Fast демонстрирует передовые агентные возможности поиска: он легко серфит веб и X, дополняя запросы актуальными данными в реальном времени. Модель умеет переходить по ссылкам, обрабатывать медиа (включая изображения и видео на X) и синтезировать результаты с молниеносной скоростью.

Benchmark pass@1

Grok 4 Fast

Grok 4

Grok 3 (без рассуждений)

BrowseComp

44.9%

43.0%

SimpleQA

95.0%

94.0%

82.0%

Reka Research Eval

66.0%

58.0%

37.0%

BrowseComp (zh)

51.2%

45.0%

10.8%

X Bench Deepsearch (zh)

74.0%

66.0%

27.0%

X Browse*

58.0%

53.2%

20.8%

*X Browse — внутренний бенчмарк, оценивающий многошаговый поиск и возможности навигации агента в X.

Передовой уровень общего пост-тренинга

Grok 4 Fast также задаёт новую планку эффективности в решении задач общего назначения. Мы рады поделиться результатами модели на LMArena, где она проходила закрытое тестирование в Search и Text Arena.

В Search Arena LMArena модель grok-4-fast-search (кодовое имя: menlo) заняла первое место с результатом 1163 Elo, опередив ближайшего конкурента o3-search на 17 пунктов. Высокая эффективность рассуждений и «плотность интеллекта» позволяют Grok 4 Fast обгонять гораздо более крупные модели в реальных задачах, связанных с поиском.

Единая модель: рассуждения и быстрые ответы

Раньше для режима рассуждений и для быстрых ответов использовались разные модели. Grok 4 Fast представляет единую архитектуру, в которой рассуждения (длинные цепочки мыслей) и короткие ответы обрабатываются одними и теми же весами модели, а поведение настраивается с помощью системных промтов. Такой подход снижает полную задержку ответа и уменьшает количество токенов, делая Grok 4 Fast отличным решением для задач, требующих реакции в реальном времени.

На grok.com это выражается в плавных переходах: для простых запросов модель отвечает мгновенно, а для сложных включает расширенный режим рассуждений. В API xAI разработчики могут гибко настраивать это поведение, выбирая баланс между скоростью и глубиной.

Grok 4 Fast уже доступен всем пользователям. В режимах Fast и Auto вы заметите значительное ускорение поиска и получения информации. Кроме того, для сложных запросов в Auto-режиме будет использоваться именно Grok 4 Fast, что обеспечит гораздо более быструю работу без потери качества. Впервые все пользователи, включая бесплатных, получили доступ к нашей последней модели без ограничений — важный шаг к демократизации продвинутого ИИ.

Grok 4 Fast на OpenRouter, Vercel AI Gateway и в xAI API

Ограниченное время Grok 4 Fast будет доступен бесплатно на OpenRouter и Vercel AI Gateway.

Мы также выпускаем Grok 4 Fast в виде двух моделей:

  • grok-4-fast-reasoning

  • grok-4-fast-non-reasoning

Каждая из них поддерживает контекстное окно в 2 млн токенов. Это позволяет разработчикам тонко настраивать вычислительные ресурсы под конкретные сценарии.

Цены на использование grok-4-fast-reasoning и grok-4-fast-non-reasoning в xAI API:

Тип токена

<128k токенов

≥128k токенов

Входные токены

$0.20 / 1M

$0.40 / 1M

Выходные токены

$0.50 / 1M

$1.00 / 1M

Кэшированные входные токены

$0.05 / 1M

Русскоязычное сообщество про AI в разработке

Друзья! Эту статью перевела команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Комментарии (0)