xAI, компания Илона Маска, 19 сентября 2025 года анонсировала выпуск Grok 4 Fast — новой модели искусственного интеллекта, которая сочетает в себе высокую производительность, низкую стоимость и огромный контекст до 2 миллионов токенов. Эта модель представляет собой значительный шаг вперед в области доступного ИИ, предлагая унифицированную архитектуру, где режимы с рассуждениями (длинные цепочки мыслей) и без рассуждений (быстрые ответы) интегрированы в одни и те же веса модели, управляемые через системные промпты. Это позволяет снизить задержку и стоимость вычислений, делая модель идеальной для реального времени приложений, таких как поиск, кодирование и вопрос-ответ системы.

В отличие от предыдущих моделей Grok, где режимы с рассуждениями и без были разделены на разные модели, Grok 4 Fast использует подкрепляющее обучение (RL) для энд-то-энд обучения работе с инструментами, включая веб-поиск, выполнение кода и обработку мультимедиа. Модель способна самостоятельно решать, когда вызывать инструменты, такие как браузинг в интернете или на платформе X (бывший Twitter), и даже обрабатывать изображения и видео из постов. Например, на запрос о максимальном количестве опыта в игре Path of Exile 2 модель просматривает несколько источников и синтезирует ответ: 4 250 334 444 XP для достижения 100 уровня.

Производительность и бенчмарки. Grok 4 Fast демонстрирует результаты, близкие к флагманским моделям, но с большей эффективностью. Согласно независимому анализу от Artificial Analysis, модель достигает индекса интеллекта 60, что соответствует Gemini 2.5 Pro и Claude 4.1 Opus, но стоит в 25 раз дешевле. Она использует на 40% меньше "мыслящих" токенов по сравнению с Grok 4, что приводит к 98% снижению стоимости для аналогичной производительности на фронтирных бенчмарках.

Вот таблица сравнения ключевых бенчмарков:

Бенчмарк

Grok 4 Fast

Grok 4

Grok 3 Mini

GPT-5 High

Gemini 2.5 Pro

GPQA Diamond

85.7%

87.5%

79.0%

85.7%

N/A

AIME 2025

92.0%

91.7%

83.0%

94.6%

N/A

HMMT 2025

93.3%

90.0%

74.0%

93.3%

N/A

HLE

20.0%

25.4%

11.0%

24.8%

N/A

LiveCodeBench (Jan-May)

80.0%

79.0%

70.0%

86.8%

N/A

BrowseComp

44.9%

43.0%

N/A

N/A

N/A

SimpleQA

95.0%

94.0%

82.0%

N/A

N/A

Reka Research Eval

66.0%

58.0%

37.0%

N/A

N/A

BrowseComp (zh)

51.2%

45.0%

10.8%

N/A

N/A

X Bench Deepsearch (zh)

74.0%

66.0%

27.0%

N/A

N/A

X Browse

58.0%

53.2%

20.8%

N/A

N/A

Данные из официального анонса xAI. Модель особенно сильна в кодировании, занимая первое место на LiveCodeBench, даже опережая Grok 4. На LMSYS Chatbot Arena вариант для поиска (кодовое имя "menlo") занимает первое место в Search Arena с Elo 1163, а текстовый вариант ("tahoe") — восьмое в Text Arena.

Доступность и ценообразование. Grok 4 Fast доступна всем пользователям на grok.com, а также в приложениях для iOS и Android в режимах "Fast" и "Auto". В "Auto" модель автоматически выбирает Grok 4 Fast для сложных запросов, чтобы ускорить ответ без потери качества. Для разработчиков доступны две версии через API xAI: с рассуждениями и без, обе с контекстом 2 млн токенов. Ценообразование агрессивное: $0.20 за 1 млн входных токенов (до 128k), $0.40 (свыше 128k), $0.50 за вых��дные (до 128k), $1.00 (свыше), и $0.05 за кэшированные входные токены. На ограниченное время модель бесплатна на OpenRouter и Vercel AI Gateway, что позволяет тестировать ее без затрат.

Обучение и данные. Модель предобучена на смеси публичных интернет-данных, данных от третьих сторон, пользовательских и внутренних данных xAI. Фильтрация включает дедупликацию и классификацию для качества и безопасности. Пост-обучение использует RLHF, проверяемые награды и супervised fine-tuning. Системные промпты опубликованы на GitHub для прозрачности.

Безопасность и ограничения. xAI внедрила политику отказа от запросов с явным вредоносным намерением, таких как создание оружия массового поражения или эксплуатация детей. Оценки показывают нулевые ответы на вредные запросы с политикой отказа. Однако без режима рассуждений растет склонность к обману (0.63 vs 0.47) и предвзятости (0.89 vs 0.79). Двойное использование оценивается на бенчмарках вроде WMDP (био: 85.2%, кибер: 81.4%), но ниже, чем у Grok 4. Фильтры ввода и митингации снижают риски, но модель может ошибаться в различении вредного намерения от любопытства.

Сравнение с конкурентами. По сравнению с Gemini 2.5 Pro, Grok 4 Fast предлагает аналогичный интеллект, но с 90% снижением стоимости и в 2.5 раза большей скоростью вывода (344 токена/с vs 188 у GPT-5). Это делает ее привлекательной для реального времени приложений. На китайских бенчмарках она опережает Grok 4, показывая улучшения в мультиязычности.

Сравнение с конкурентами.
Сравнение с конкурентами.

Влияние на индустрию. Выпуск Grok 4 Fast подчеркивает тенденцию к снижению стоимости интеллекта, что может ускорить внедрение ИИ в бизнесе и потребительских приложениях. Пользователи на X отмечают ее скорость (до 10x быстрее Grok 4) и эффективность в задачах вроде автоматизированного тестирования и фильтрации больших контекстов. xAI позиционирует модель как шаг к более плотному интеллекту, где производительность на токен выше, что открывает двери для новых сценариев использования.

В целом, Grok 4 Fast — это не просто обновление, а демонстрация, как xAI стремится democratизировать ИИ, делая его быстрее, дешевле и мощнее, без компромиссов в безопасности.

Комментарии (0)


  1. NeoCode
    20.09.2025 14:54

    А в старом бесплатном Grok Fast какой размер контекста? По ощущениям тоже немаленький, около мегабайта или чуть меньше.


  1. SensDj
    20.09.2025 14:54

    Grok 4 Fast доступна всем пользователям на grok.com

    зачем обманываете ?


    1. teknik2008
      20.09.2025 14:54

      А что не так?


      1. SensDj
        20.09.2025 14:54

        при переходе по ссылке пишет This service is not available in your region.

        о таких вещах в других статьях хотя бы предупреждают, а тут автор пишет "Grok 4 Fast доступна всем пользователям"


        1. RSM
          20.09.2025 14:54

          Не всем желающим, а всем пользователям. А пользователем можно стать только в тех регионах в которых доступно.


        1. Hardcoin
          20.09.2025 14:54

          Вы не пользователь грока, поэтому вам недоступна. Пользователям доступна всем.


  1. anonymous
    20.09.2025 14:54


  1. Politura
    20.09.2025 14:54

    xAI меняет правила: Grok 4 Fast – сверхбыстрый ИИ с 2 млн токенов контекста бесплатно! Что если модель, равная Gemini 2.5 Pro, но в 25 раз дешевле, уже здесь?

    Так бесплатно, или в 25 раз дешевле?


  1. pol_pot
    20.09.2025 14:54

    Модель особенно сильна в кодировании, занимая первое место на LiveCodeBench, даже опережая Grok 4.

    Полчаса пытался через хтмл нарисовать часы... очень сильная модель, особенно в кодировании.