xAI представляет Grok 4 Fast: новая эра доступного ИИ с огромным контекстом / forpes.ru

Главная
xAI представляет Grok 4 Fast: новая эра доступного ИИ с огромным контекстом

xAI представляет Grok 4 Fast: новая эра доступного ИИ с огромным контекстом +2

20.09.2025 14:11

Alex679 0 5400 Источник

xAI, компания Илона Маска, 19 сентября 2025 года анонсировала выпуск Grok 4 Fast — новой модели искусственного интеллекта, которая сочетает в себе высокую производительность, низкую стоимость и огромный контекст до 2 миллионов токенов. Эта модель представляет собой значительный шаг вперед в области доступного ИИ, предлагая унифицированную архитектуру, где режимы с рассуждениями (длинные цепочки мыслей) и без рассуждений (быстрые ответы) интегрированы в одни и те же веса модели, управляемые через системные промпты. Это позволяет снизить задержку и стоимость вычислений, делая модель идеальной для реального времени приложений, таких как поиск, кодирование и вопрос-ответ системы.

В отличие от предыдущих моделей Grok, где режимы с рассуждениями и без были разделены на разные модели, Grok 4 Fast использует подкрепляющее обучение (RL) для энд-то-энд обучения работе с инструментами, включая веб-поиск, выполнение кода и обработку мультимедиа. Модель способна самостоятельно решать, когда вызывать инструменты, такие как браузинг в интернете или на платформе X (бывший Twitter), и даже обрабатывать изображения и видео из постов. Например, на запрос о максимальном количестве опыта в игре Path of Exile 2 модель просматривает несколько источников и синтезирует ответ: 4 250 334 444 XP для достижения 100 уровня.

Производительность и бенчмарки. Grok 4 Fast демонстрирует результаты, близкие к флагманским моделям, но с большей эффективностью. Согласно независимому анализу от Artificial Analysis, модель достигает индекса интеллекта 60, что соответствует Gemini 2.5 Pro и Claude 4.1 Opus, но стоит в 25 раз дешевле. Она использует на 40% меньше "мыслящих" токенов по сравнению с Grok 4, что приводит к 98% снижению стоимости для аналогичной производительности на фронтирных бенчмарках.

Вот таблица сравнения ключевых бенчмарков:

Бенчмарк	Grok 4 Fast	Grok 4	Grok 3 Mini	GPT-5 High	Gemini 2.5 Pro
GPQA Diamond	85.7%	87.5%	79.0%	85.7%	N/A
AIME 2025	92.0%	91.7%	83.0%	94.6%	N/A
HMMT 2025	93.3%	90.0%	74.0%	93.3%	N/A
HLE	20.0%	25.4%	11.0%	24.8%	N/A
LiveCodeBench (Jan-May)	80.0%	79.0%	70.0%	86.8%	N/A
BrowseComp	44.9%	43.0%	N/A	N/A	N/A
SimpleQA	95.0%	94.0%	82.0%	N/A	N/A
Reka Research Eval	66.0%	58.0%	37.0%	N/A	N/A
BrowseComp (zh)	51.2%	45.0%	10.8%	N/A	N/A
X Bench Deepsearch (zh)	74.0%	66.0%	27.0%	N/A	N/A
X Browse	58.0%	53.2%	20.8%	N/A	N/A

Данные из официального анонса xAI. Модель особенно сильна в кодировании, занимая первое место на LiveCodeBench, даже опережая Grok 4. На LMSYS Chatbot Arena вариант для поиска (кодовое имя «menlo») занимает первое место в Search Arena с Elo 1163, а текстовый вариант («tahoe») — восьмое в Text Arena.

Доступность и ценообразование. Grok 4 Fast доступна всем пользователям на grok.com, а также в приложениях для iOS и Android в режимах «Fast» и «Auto». В «Auto» модель автоматически выбирает Grok 4 Fast для сложных запросов, чтобы ускорить ответ без потери качества. Для разработчиков доступны две версии через API xAI: с рассуждениями и без, обе с контекстом 2 млн токенов. Ценообразование агрессивное: $0.20 за 1 млн входных токенов (до 128k), $0.40 (свыше 128k), $0.50 за выходные (до 128k), $1.00 (свыше), и $0.05 за кэшированные входные токены. На ограниченное время модель бесплатна на OpenRouter и Vercel AI Gateway, что позволяет тестировать ее без затрат.

Обучение и данные. Модель предобучена на смеси публичных интернет-данных, данных от третьих сторон, пользовательских и внутренних данных xAI. Фильтрация включает дедупликацию и классификацию для качества и безопасности. Пост-обучение использует RLHF, проверяемые награды и супervised fine-tuning. Системные промпты опубликованы на GitHub для прозрачности.

Безопасность и ограничения. xAI внедрила политику отказа от запросов с явным вредоносным намерением, таких как создание оружия массового поражения или эксплуатация детей. Оценки показывают нулевые ответы на вредные запросы с политикой отказа. Однако без режима рассуждений растет склонность к обману (0.63 vs 0.47) и предвзятости (0.89 vs 0.79). Двойное использование оценивается на бенчмарках вроде WMDP (био: 85.2%, кибер: 81.4%), но ниже, чем у Grok 4. Фильтры ввода и митингации снижают риски, но модель может ошибаться в различении вредного намерения от любопытства.

Сравнение с конкурентами. По сравнению с Gemini 2.5 Pro, Grok 4 Fast предлагает аналогичный интеллект, но с 90% снижением стоимости и в 2.5 раза большей скоростью вывода (344 токена/с vs 188 у GPT-5). Это делает ее привлекательной для реального времени приложений. На китайских бенчмарках она опережает Grok 4, показывая улучшения в мультиязычности.

Влияние на индустрию. Выпуск Grok 4 Fast подчеркивает тенденцию к снижению стоимости интеллекта, что может ускорить внедрение ИИ в бизнесе и потребительских приложениях. Пользователи на X отмечают ее скорость (до 10x быстрее Grok 4) и эффективность в задачах вроде автоматизированного тестирования и фильтрации больших контекстов. xAI позиционирует модель как шаг к более плотному интеллекту, где производительность на токен выше, что открывает двери для новых сценариев использования.

В целом, Grok 4 Fast — это не просто обновление, а демонстрация, как xAI стремится democratизировать ИИ, делая его быстрее, дешевле и мощнее, без компромиссов в безопасности.

Комментарии (0)

NeoCode
20.09.2025 14:54
#28861070
А в старом бесплатном Grok Fast какой размер контекста? По ощущениям тоже немаленький, около мегабайта или чуть меньше.

SensDj
20.09.2025 14:54
#28861094
Grok 4 Fast доступна всем пользователям на grok.com,

зачем обманываете ?
1. teknik2008
  20.09.2025 14:54
  #28861286
  А что не так?
  1. SensDj
    20.09.2025 14:54
    #28861690
    при переходе по ссылке пишет This service is not available in your region.
    
    о таких вещах в других статьях хотя бы предупреждают, а тут автор пишет "Grok 4 Fast доступна всем пользователям"
    
    RSM
    20.09.2025 14:54
    #28862054
    Не всем желающим, а всем пользователям. А пользователем можно стать только в тех регионах в которых доступно.
    
    Hardcoin
    20.09.2025 14:54
    #28862486
    Вы не пользователь грока, поэтому вам недоступна. Пользователям доступна всем.

anonymous
20.09.2025 14:54
#28861450

Politura
20.09.2025 14:54
#28861704
xAI меняет правила: Grok 4 Fast – сверхбыстрый ИИ с 2 млн токенов контекста бесплатно! Что если модель, равная Gemini 2.5 Pro, но в 25 раз дешевле, уже здесь?

Так бесплатно, или в 25 раз дешевле?
1. AleGen
  20.09.2025 14:54
  #28865992
  Через чат - бесплатно, по api - в 25 раз дешевле.

pol_pot
20.09.2025 14:54
#28862620
Модель особенно сильна в кодировании, занимая первое место на LiveCodeBench, даже опережая Grok 4.

Полчаса пытался через хтмл нарисовать часы... очень сильная модель, особенно в кодировании.
1. holodoz
  20.09.2025 14:54
  #28863936
  Видно же, что нужно три константы подправить и цифровое время совпадет с аналоговым. Слабый пример
  1. pol_pot
    20.09.2025 14:54
    #28863970
    Это еще не худший вариант. Нормального ни одного не получилось.
1. CherryFull
  20.09.2025 14:54
  #28866872
  Ну не знаю со второго запроса.
  
  Первый запрос:
  
  Используя HTML, CSS и JavaScript сделай:
  
  Рабочие аналоговые часы (с большой, маленькой и секундной стрелками), с циферблатом и делениями от 1 до 12, чтобы показывали текущее время.
  
  Добавить ниже цифровые часы, на черном фоне, цифры зеленым. Пример: HH:MM:SS Результат выдай в один файл.
  
  Запрос 1
  Второй запрос:
  
  Исправь:
  
  аналоговые часы должны показывать текущее время в реальном времени.
  
  циферблат не должен выходить за черный круг
  
  Запрос 2
  1. pol_pot
    20.09.2025 14:54
    #28867478
    Хз, использую версию фри с опенроутера, температура 0.2, ризонинг максимальный.
    
    Ж)
    
    pol_pot
    20.09.2025 14:54
    #28867496
    А это обычный старый джемини флеш 2.5, с первого раза