
xAI, компания Илона Маска, 19 сентября 2025 года анонсировала выпуск Grok 4 Fast — новой модели искусственного интеллекта, которая сочетает в себе высокую производительность, низкую стоимость и огромный контекст до 2 миллионов токенов. Эта модель представляет собой значительный шаг вперед в области доступного ИИ, предлагая унифицированную архитектуру, где режимы с рассуждениями (длинные цепочки мыслей) и без рассуждений (быстрые ответы) интегрированы в одни и те же веса модели, управляемые через системные промпты. Это позволяет снизить задержку и стоимость вычислений, делая модель идеальной для реального времени приложений, таких как поиск, кодирование и вопрос-ответ системы.
В отличие от предыдущих моделей Grok, где режимы с рассуждениями и без были разделены на разные модели, Grok 4 Fast использует подкрепляющее обучение (RL) для энд-то-энд обучения работе с инструментами, включая веб-поиск, выполнение кода и обработку мультимедиа. Модель способна самостоятельно решать, когда вызывать инструменты, такие как браузинг в интернете или на платформе X (бывший Twitter), и даже обрабатывать изображения и видео из постов. Например, на запрос о максимальном количестве опыта в игре Path of Exile 2 модель просматривает несколько источников и синтезирует ответ: 4 250 334 444 XP для достижения 100 уровня.
Производительность и бенчмарки. Grok 4 Fast демонстрирует результаты, близкие к флагманским моделям, но с большей эффективностью. Согласно независимому анализу от Artificial Analysis, модель достигает индекса интеллекта 60, что соответствует Gemini 2.5 Pro и Claude 4.1 Opus, но стоит в 25 раз дешевле. Она использует на 40% меньше "мыслящих" токенов по сравнению с Grok 4, что приводит к 98% снижению стоимости для аналогичной производительности на фронтирных бенчмарках.
Вот таблица сравнения ключевых бенчмарков:
Бенчмарк |
Grok 4 Fast |
Grok 4 |
Grok 3 Mini |
GPT-5 High |
Gemini 2.5 Pro |
---|---|---|---|---|---|
GPQA Diamond |
85.7% |
87.5% |
79.0% |
85.7% |
N/A |
AIME 2025 |
92.0% |
91.7% |
83.0% |
94.6% |
N/A |
HMMT 2025 |
93.3% |
90.0% |
74.0% |
93.3% |
N/A |
HLE |
20.0% |
25.4% |
11.0% |
24.8% |
N/A |
LiveCodeBench (Jan-May) |
80.0% |
79.0% |
70.0% |
86.8% |
N/A |
BrowseComp |
44.9% |
43.0% |
N/A |
N/A |
N/A |
SimpleQA |
95.0% |
94.0% |
82.0% |
N/A |
N/A |
Reka Research Eval |
66.0% |
58.0% |
37.0% |
N/A |
N/A |
BrowseComp (zh) |
51.2% |
45.0% |
10.8% |
N/A |
N/A |
X Bench Deepsearch (zh) |
74.0% |
66.0% |
27.0% |
N/A |
N/A |
X Browse |
58.0% |
53.2% |
20.8% |
N/A |
N/A |
Данные из официального анонса xAI. Модель особенно сильна в кодировании, занимая первое место на LiveCodeBench, даже опережая Grok 4. На LMSYS Chatbot Arena вариант для поиска (кодовое имя "menlo") занимает первое место в Search Arena с Elo 1163, а текстовый вариант ("tahoe") — восьмое в Text Arena.
Доступность и ценообразование. Grok 4 Fast доступна всем пользователям на grok.com, а также в приложениях для iOS и Android в режимах "Fast" и "Auto". В "Auto" модель автоматически выбирает Grok 4 Fast для сложных запросов, чтобы ускорить ответ без потери качества. Для разработчиков доступны две версии через API xAI: с рассуждениями и без, обе с контекстом 2 млн токенов. Ценообразование агрессивное: $0.20 за 1 млн входных токенов (до 128k), $0.40 (свыше 128k), $0.50 за вых��дные (до 128k), $1.00 (свыше), и $0.05 за кэшированные входные токены. На ограниченное время модель бесплатна на OpenRouter и Vercel AI Gateway, что позволяет тестировать ее без затрат.
Обучение и данные. Модель предобучена на смеси публичных интернет-данных, данных от третьих сторон, пользовательских и внутренних данных xAI. Фильтрация включает дедупликацию и классификацию для качества и безопасности. Пост-обучение использует RLHF, проверяемые награды и супervised fine-tuning. Системные промпты опубликованы на GitHub для прозрачности.
Безопасность и ограничения. xAI внедрила политику отказа от запросов с явным вредоносным намерением, таких как создание оружия массового поражения или эксплуатация детей. Оценки показывают нулевые ответы на вредные запросы с политикой отказа. Однако без режима рассуждений растет склонность к обману (0.63 vs 0.47) и предвзятости (0.89 vs 0.79). Двойное использование оценивается на бенчмарках вроде WMDP (био: 85.2%, кибер: 81.4%), но ниже, чем у Grok 4. Фильтры ввода и митингации снижают риски, но модель может ошибаться в различении вредного намерения от любопытства.
Сравнение с конкурентами. По сравнению с Gemini 2.5 Pro, Grok 4 Fast предлагает аналогичный интеллект, но с 90% снижением стоимости и в 2.5 раза большей скоростью вывода (344 токена/с vs 188 у GPT-5). Это делает ее привлекательной для реального времени приложений. На китайских бенчмарках она опережает Grok 4, показывая улучшения в мультиязычности.

Влияние на индустрию. Выпуск Grok 4 Fast подчеркивает тенденцию к снижению стоимости интеллекта, что может ускорить внедрение ИИ в бизнесе и потребительских приложениях. Пользователи на X отмечают ее скорость (до 10x быстрее Grok 4) и эффективность в задачах вроде автоматизированного тестирования и фильтрации больших контекстов. xAI позиционирует модель как шаг к более плотному интеллекту, где производительность на токен выше, что открывает двери для новых сценариев использования.
В целом, Grok 4 Fast — это не просто обновление, а демонстрация, как xAI стремится democratизировать ИИ, делая его быстрее, дешевле и мощнее, без компромиссов в безопасности.
Комментарии (0)
SensDj
20.09.2025 14:54Grok 4 Fast доступна всем пользователям на grok.com,
зачем обманываете ?
teknik2008
20.09.2025 14:54А что не так?
SensDj
20.09.2025 14:54при переходе по ссылке пишет This service is not available in your region.
о таких вещах в других статьях хотя бы предупреждают, а тут автор пишет "Grok 4 Fast доступна всем пользователям"
RSM
20.09.2025 14:54Не всем желающим, а всем пользователям. А пользователем можно стать только в тех регионах в которых доступно.
Hardcoin
20.09.2025 14:54Вы не пользователь грока, поэтому вам недоступна. Пользователям доступна всем.
Politura
20.09.2025 14:54xAI меняет правила: Grok 4 Fast – сверхбыстрый ИИ с 2 млн токенов контекста бесплатно! Что если модель, равная Gemini 2.5 Pro, но в 25 раз дешевле, уже здесь?
Так бесплатно, или в 25 раз дешевле?
pol_pot
20.09.2025 14:54Модель особенно сильна в кодировании, занимая первое место на LiveCodeBench, даже опережая Grok 4.
Полчаса пытался через хтмл нарисовать часы... очень сильная модель, особенно в кодировании.
NeoCode
А в старом бесплатном Grok Fast какой размер контекста? По ощущениям тоже немаленький, около мегабайта или чуть меньше.