Grok 4 от xAI: самый умный ИИ на планете? / forpes.ru

Главная
Grok 4 от xAI: самый умный ИИ на планете?

Grok 4 от xAI: самый умный ИИ на планете? -2

15.07.2025 15:00

Webtrinity 5 5500 Источник

«Это самый умный ИИ на планете» — так начали презентацию Grok 4 от xAI. Илон Маск лично представил свою новую модель и заявил, что впервые искусственный интеллект способен решать сложные задачи, в том числе инженерные, ответы на которые нельзя просто найти ни в интернете, ни в учебниках.

Смелое заявление, правда? Давайте разберёмся, что такого сделали Илон Маск и его команда.

В этой статье вы узнаете:
— чем Grok 4 отличается от других нейросетей;
— как именно его обучали и почему это важно;
— какие рекордные результаты он показал в тестах;
— и главное — чем всё это может быть полезно в повседневной жизни, то есть как использовать этот ИИ с конкретной пользой для себя.

Стратегия xAI: что сделали иначе?

Давайте начнём с главного — как вообще создавали Grok 4 и чем он отличается от всех остальных.

Фишка тут в том, как его учили. Если по-простому: любую нейросеть тренируют, скармливая ей тонны текстов, задач, примеров, чтобы она училась находить закономерности и давать правильные ответы.

Так вот, xAI заявили, что при создании Grok 4 задействовали примерно в 10 раз больше вычислительной мощности и данных, чем для предыдущей версии. Представьте суперкомпьютер с тысячами видеокарт — вот на таком «железе» днями и ночами тренировался новый мозг Грока. За счёт этого Grok стал умнее своего предшественника (Grok 3), потому что ему дали намного больше примеров и времени на обучение.

Но кроме того, и само обучение проходило иначе, по-новому: сразу с “инструментами”.

Что это значит?

Инструменты — это встроенные помощники: например, возможность сделать веб-поиск, запустить калькулятор или выполнить кусочек кода, когда это нужно.

Разработчики xAI с самого начала учили Grok пользоваться такими инструментами, заходить в поисковые системы, анализировать документы и запускать программы. Это похоже на то, как если бы ученику не только давали учебник, но и сразу показывали, как искать информацию в библиотеке и пользоваться компьютером.

Зачем это нужно?

Чтобы модель не ограничивалась только тем, что запомнила, а умела ориентироваться в интернете, находить актуальные данные и проверять себя.

То есть, если спросить что-то про события этого года или задать сложный вопрос, на который нет ответа в интернете, Grok 4 может тут же сделать поиск в сети или написать и запустить небольшую программу, чтобы убедиться в правильности ответа.

Такой подход помог сделать Грок не просто эрудированным, но и научиться думать, как исследователь: проверять факты, читать источники, не полагаться лишь на память.

В результате, по словам разработчиков, Grok 4 получился не «болтуном», а именно партнёром для логических рассуждений.

Вместе с Grok 4 представили и версию Grok 4 Heavy.

Что это такое?
Grok 4 Heavy — это специальный режим работы, когда модель задействует сразу несколько «агентов» (как бы копий себя) для решения одной задачи.

Каждый из «агентов Grok» параллельно думает над вопросом, обменивается идеями с другими и в итоге они сверяют ответы между собой и выбирают лучший. Это похоже на мозговой штурм среди нескольких ИИ: если один где-то ошибся или что-то упустил, другой может это заметить. В итоге точность ответа повышается, потому что несколько «мозгов» видят проблему с разных сторон и взаимно исправляют ошибки друг друга.

Почему это повышает точность?
Потому что даже очень умный одиночный ИИ может пойти по неверному пути рассуждений, особенно на сложных задачах. А когда их несколько, шанс, что все ошибутся одинаково, намного ниже.

В презентации показали, что этот режим заметно улучшил результаты на самых хитрых тестах — о них я скажу позже.

Конечно, за всё приходится платить: такая команда ИИ работает медленнее и требует больше ресурсов. Появилась подписка SuperGrok Heavy, которая стоит $300 в месяц.

Я думаю, обычным пользователям в бытовых задачах Heavy ни к чему — там и обычный Grok справится быстрее. Heavy — для тех случаев, когда вопрос действительно сложный и цена ошибки высока.

Результаты и бенчмарки: Grok против всех

Теперь — про результаты тестов.

На самой презентации разработчики показали много графиков, где Grok обходит по показателям другие модели от других компаний. Но я специально подождала вердикта от индустрии.

Так вот: Grok 4 стал топ-1 на бенчмарке, который называется ARC-AGI. Если коротко — это один из самых сложных тестов для проверки гибкости ИИ. Его специально придумали, чтобы оценивать не просто заученные знания, а именно способность учиться на лету, решать новые задачи, как это делает человек.

И вот главное: до сих пор даже самые продвинутые модели вроде Claude Opus 4 показывали там около 8% правильных решений. Всё, что ниже 10% — считается просто случайным шумом, не настоящим интеллектом.

А теперь представьте: Grok 4 показал 15,9%! Это первый публичный ИИ, который не просто угадал, а реально прошёл планку, где уже начинается «живое мышление», условно говоря.

Причём, это подтвердили не просто свои тесты, а официальная команда ARC-AGI. Они написали: «Мы слышали, что Grok хорош, но не думали, что он станет номером один».

Что это значит на практике?

Grok не просто запомнил кучу фактов. Он умеет учиться на новых задачах прямо во время теста, как настоящий человек. Это уже не просто болталка для чатов, а ИИ, который может сам осваивать новые штуки и применять их в реальной жизни.

Важно, конечно, отметить: бенчмарки не показывают всего. Иногда модели учатся «подстраиваться» под тесты, и высокие цифры не гарантируют идеальной работы во всех реальных задачах.

Но в целом прогресс впечатляет. Grok 4 действительно вышел за рамки привычных сценариев и начал показывать поведение, которое ближе к настоящему обучению, а не просто воспроизведению заученного.

Зачем это нам? Примеры пользы в реальной жизни

Тесты тестами, но вы можете спросить:
«Ну окей, ИИ набрал много баллов на каком-то там тесте, а мне-то что с того? Как это влияет на мою жизнь?»

Отличный вопрос. Я сама говорю, что сейчас примерно все модели ИИ достигли такого уровня, что на повседневных задачах разница между Grok, ChatGPT, Claude, Gemimi — не очень-то и заметна.

Но! Разработчики xAI на презентации постарались показать, как возможности Grok 4 могут применяться на практике, в том числе для обычных людей, бизнеса и науки.

Во-первых, симуляция бизнеса с торговыми автоматами

Это действительно интересно. Команда xAI позвала независимых исследователей, которые придумали виртуальный эксперимент под названием Vending-Bench. В этом тесте разные ИИ играют роль управляющего небольшим бизнесом по продаже напитков и снеков через торговые автоматы.

Задача: на протяжении длительного времени (сотни циклов имитации, как бы дней) принимать решения — когда и чем пополнить автоматы, по какой цене продавать, как реагировать на спрос, когда делать скидки, как управлять запасами и финансами.

В конкурсе участвовали несколько ИИ-моделей, и даже была заложена модель поведения человека-управляющего для сравнения.

И вот результат:
— Grok 4 заработал больше всех денег за время симуляции. Он завершил игру с прибылью около $4 694 и продав около 5 тысяч единиц товара.
— Ближайший ИИ-конкурент, Claude 4, заработал примерно $2 077 — вдвое меньше.
— Человек-бизнесмен и того меньше — около $844 прибыли.

По сути, Grok за время игры обошёл человека примерно в 5–6 раз по итогам прибыли.

ИИ смог лучше прогнозировать спрос, оптимально управлять ценами и запасами.

Для нас это пример того, как ИИ может помогать в бизнесе и финансах: от принятия решений в длинной перспективе до автоматизации управления.

Конечно, в реальной жизни всё сложнее, но такой «менеджер-бот» мог бы советовать предпринимателям, оптимизировать логистику, находить узкие места и делать это быстрее и хладнокровнее человека.

Еще один важный аспект: работа с реальными данными в режиме реального времени

Разработчики отдельно подчёркивают: Grok 4 умеет не только решать задачки в вакууме, но и подключаться к реальным данным. Например, он может в режиме реального времени тянуть биржевые котировки, новости — и сразу их анализировать.

Комбинация вот этой свежей информации и мощной логики делает Grok сильным инструментом для прогнозов.

Простыми словами: он может мониторить новости и цифры 24/7 и выдавать осмысленные выводы. Например: «Судя по трендам, ожидается рост цен на нефть, потому что...» — и подкрепить это ссылками на источники и расчётами.

Конечно, как это будет применяться, ещё нужно проверять: версия Grok 4 только вышла, и нужно время, чтобы понять, сходятся ли прогнозы с реальностью.

Интеграция с Polymarket: мудрость толпы + ИИ

Есть ещё одна очень крутая штука, про которую стоит сказать отдельно: интеграция Grok 4 с платформой Polymarket.

Если не слышали, Polymarket — это биржа ставок на реальные события. Люди там голосуют: кто выиграет выборы, поднимут ли ставки в Америке и так далее. Это как коллективный прогноз, где каждый ставит на то, что считает вероятным. Такая мудрость толпы.

Теперь Grok 4 официально умеет использовать эти данные. На презентации даже показывали, как это работает, например, для спортивных прогнозов: модель смотрит ставки на Polymarket, одновременно мониторит соцсети — ту же X — и на основе всего этого даёт свой прогноз. Причём не просто: «думаю, так-то», а с объяснением, откуда взялась такая вероятность.

Фишка тут в том, что соединяются два мира: человеческие интуитивные предсказания и расчёты ИИ. Люди умеют чувствовать атмосферу и тренды, а нейросеть — видеть закономерности и факты. Вместе это может быть невероятно сильным инструментом для предсказаний!

Для нас с вами это значит, что скоро могут появиться сервисы, где вы спрашиваете: «Цены на квартиры пойдут вверх или вниз?» — а Grok берёт данные из Polymarket, смотрит, что люди думают, плюс анализирует новости и даёт вам ответ с аргументами. Согласитесь, это полезно.

В общем, всё это ещё надо проверить на практике, но судя по примерам, можно сказать: Grok 4 — это не просто бот, а целая платформа с кучей инструментов.

Конечно, обычному человеку всё сразу не понадобится, но какие-то функции могут прийти в нашу жизнь уже совсем скоро.

Где у Grok 4 настоящее преимущество

Вообще, если подумать, у Grok 4 до недавнего времени был один большой минус. Да, он умный, тесты классно проходит, но конкурировать с гигантами типа OpenAI или Google было тяжело. У них уже миллионы пользователей: у OpenAI своё топовое приложение и универсальные модели, у Google — куча сервисов, где их ИИ встроен по умолчанию.

Но знаете, что может стать главным преимуществом Grok на практике? Интеграция с платформами, где происходит вся актуальная дискуссия — от науки до крипты.

И вот тут у xAI реально есть сильный ход. Grok уже встроен в соцсеть X — а это место, где сидят и криптоны, и стартаперы, и научное сообщество. Там обсуждают всё самое свежее: рынки, технологии, открытия. Это значит, Grok подключён сразу к пульсу событий — он прямо внутри этих разговоров.

Плюс, не забываем про Polymarket. Вот это вообще может стать золотой пулей для Grok и всей компании xAI. Их коллаборация с Polymarket даёт Grok доступ к живым ожиданиям толпы, и если правильно это использовать, у модели появляется почти реальный радар по всему, что происходит в мире.

И конечно, Telegram. Там тоже огромная часть живого общения, новости, инсайды, экспертные чаты — всё в режиме реального времени. И то, что xAI собирается плотно интегрироваться с Telegram, это тоже прямо сильный шаг.

И если xAI сделает на это ставку, развивает именно это направление, у Grok все шансы стать тем самым ИИ, который нужен человеку.

Что в итоге?

Ну что, давайте подведём итог. Grok 4 — реально мощный шаг вперёд. Новый уровень в тестах, умение работать в команде агентов, интернет-инструменты, помощь в бизнесе, науке, медицине. Всё это звучит круто.

Но! Лично мне вот какая мысль близка: все эти бенчмарки, тесты, проценты — это, конечно, важно. Но в какой-то момент ИИ всё равно их все пройдёт. И нам уже будет неинтересно: набрал он 95% или 96, или 100.

Реальный бенчмарк для всех нас — это жизнь. Насколько ИИ реально помогает каждый день: выдаёт новые технологии, придумывает идеи, решает задачи, которые раньше только человек мог решить. Вот это — настоящий тест. И у Grok, честно говоря, есть шанс первым этот жизненный бенчмарк пройти.

Сам Маск, кстати, говорил, что уже в этом или следующем году ИИ сможет реально выдавать новые технологии, о которых человечество даже не мечтало. Он может придумать новую физику, лекарство, что угодно — чего не могло бы появиться без ИИ. От этого дух захватывает!

И ещё у меня есть к вам предложение. Давайте соберём список того, чего реально не хватает в Grok 4. Что бы вы хотели, чтобы он умел?

Я вставлю ниже ссылку на тред, а пишите туда ваши идеи. Пусть Илон Маск прочитает и возьмёт на заметку. Почему нет, правда? Всё-таки мы с вами сейчас уже не просто наблюдаем за развитием ИИ, а участвуем во всем этом.

Ссылка на тред (тут будет ссылка)

Мой YouTube‑канал https://www.youtube.com/@Web3nity

Мой тг: https://t.me/web3nity_channel

Комментарии (5)

fish224
15.07.2025 15:51
#28576162
я специально подождала

Я сам говорю

Видно некачественный перевод

pol_pot
15.07.2025 15:51
#28577638
На арене появились его результаты и они выглядят... адекватно, то что он не чемпион видно было сразу

Sapsan_Sapsanov
15.07.2025 15:51
#28577988
Работает с криптой, биржей. Во оно что!

Не кажется ли мне, что, статья попахивает заказухой. Для свидетелей секты Маска )

Pitfil
15.07.2025 15:51
#28584766
И то, что xAI собирается плотно интегрироваться с Telegram, это тоже прямо сильный шаг.

С подключением) Дуров в мае что-то ляпнул, Маск сказал, что соглашение не подписано, и с тех пор 0 заявлений по этому поводу.

Учитывая те политические пертурбации, в которые попал Маск после этого, я думаю, никому из сторон это неинтересно на данный момент.

Ещё была какая-то новость, где Дуров сказал, что его брат разрабатывает "настоящий ии", так что выводы делайте сами, состоится ли интеграция с гроком.

Grok 4 от xAI: самый умный ИИ на планете? -2

Стратегия xAI: что сделали иначе?

Вместе с Grok 4 представили и версию Grok 4 Heavy.

Результаты и бенчмарки: Grok против всех

Зачем это нам? Примеры пользы в реальной жизни

Где у Grok 4 настоящее преимущество

Что в итоге?

Комментарии (5)

fish224

pol_pot

Sapsan_Sapsanov

Pitfil