ChatGPT все еще не догнать: что происходит на ИИ-рынке к середине 2025 года? / forpes.ru

Главная
ChatGPT все еще не догнать: что происходит на ИИ-рынке к середине 2025 года?

ChatGPT все еще не догнать: что происходит на ИИ-рынке к середине 2025 года? +3

16.06.2025 18:32

runaway_llm 9 4900 Источник

Привет! С вами Андрей с канала «сбежавшая нейросеть» и сегодня я предлагаю оценить ситуацию на рынке ИИ: 2025 год подходит к экватору, поэтому самое время посмотреть, как поменялись позиции крупнейших компаний‑разработчиков. Но для начала предлагаю посмотреть на две иллюстрации. Первая — рейтинг ИИ от ресурса LMArena.

Сразу отмечу - лично я не могу назвать рейтинг ИИ, который был бы идеальным, но LMArena, на мой взгляд, находится ближе всего к такому. Этот ресурс проводит слепое сравнение: пользователь делает запрос, ему показываются "анонимные" ответы двух моделей, после чего он выбирает лучший. Это делает результаты рейтинга максимально близкими к практическому использованию ИИ. В рейтинге четко видно, что лидерами являются ChatGPT (OpenAI) и Gemini (Google), затем с небольшим отставанием идут Claude (Anthropic) и Grok 3 (xAI), и с более серьезным — DeepSeek. В таком порядке и рассмотрим модели, но сначала — еще одна картинка. На этот раз от SimilarWeb с оценкой распределения трафика между разными ИИ-сервисами.

Учитывайте, что данные SimilarWeb оценочные и не включают, например, использование моделей Google внутри поисковой системы компании и в операционной системе Android. Но картина все равно впечатляющая: почти 80% трафика приходится на ChatGPT. Все-таки ранний выход на ИИ-рынок является огромным преимуществом OpenAI — для большинства моих знакомых ChatGPT до сих пор остается синонимом "искусственного интеллекта". С него и начнем. Добавлю, что в тексте ниже я буду рассматривать модели с позиции человека, готового оплатить 1-2 базовых подписки по 20 долларов. Это более близкий массовому пользователю подход, чем работа с ИИ по API (извиняюсь перед всеми, кто работает с ИИ именно таким образом).

ChatGPT (OpenAI)

Несмотря на локальные провалы, вроде дорогой и медленной GPT-4.5, модели компании остаются одними из самых сильных. ChatGPT-4o — отличный чатбот, который подходит для ежедневных вопросов, быстрого веб-поиска и разговоров обо всем. ChatGPT o3 и o4-mini — рассуждающие модели для кодинга, решения сложных задач и более глубокого веб-поиска. Также отмечу, что ChatGPT отлично генерирует картинки, а начиная с подписки Plus в него входит Codex-1 — веб-агент для программистов, способный работать с репозиторием в GitHub. Кому-то может показаться полезной функция DeepResearch, когда модель тратит 10-30 минут на поиск в интернете и возвращается с детальным отчетом.

Минусы также есть. В последние месяцы OpenAI наплодила огромное количество моделей (к перечисленным выше можно добавить GPT-4.5 и GPT-4.1), выбор между которыми далеко не всегда очевиден даже для опытного пользователя. Кроме того, в 20-долларовой Plus-подписке у многих моделей строгие лимиты использования: например, мощная o3 ограничена лишь 200 запросами в неделю, а GPT-4.5 - и вовсе 10 запросами. Ситуация должна поменяться с выходом ChatGPT-5 - это будет "роутер", анализирующий запрос пользователя и решающий, какой модели его передать. Но пока живем с тем, что есть.

Ну и главный вопрос к OpenAI: все-таки прошли те времена, когда компания была абсолютным лидером на рынке, первой выкатывая почти все новинки в мире ИИ. Теперь у нее есть как минимум один серьезный конкурент.

Gemini (Google)

Принадлежащая Google компания DeepMind — один из ветеранов в области разработки ИИ. К примеру, её система AlphaGo в 2016 году победила 18-кратного чемпиона мира по го Ли Седоля, а созданный впоследствии алгоритм AlphaFold предсказал трёхмерную структуру около 98 % белков человеческого протеома, фактически решив многолетнюю «проблему сворачивания белков». Но вот на рынке коммерческих моделей Google еще в начале года особо ничем не блистала.

Все поменялось в конце марта с выходом первой версии Gemini 2.5 Pro: новая рассуждающая модель сразу заняла одни из первых позиций в большинстве рейтингов. Следом вышла более быстрая 2.5 Flash, идеально подходящая для повседневных вопросов и чата. Из своего опыта добавлю еще одну удивительную вещь: модели Google сейчас зацензурены меньше других и часто берутся за промпт, на который ChatGPT и Claude дают отказ.

Также в активе Google очень неплохая генерация изображений ImageGen 4.0 и Veo 3, которую многие считают лучшей системой создания видео. Компания постоянно экспериментирует с чем-то новым: есть ИИ-видеоредактор Flow, очень интересное приложение для создания саммари NotebookLM и собственный агент для кодинга Jules. Ну и убийственная фича Gemini — гигантское контекстное окно в 1 миллион токенов даже в 20-долларовой подписке Pro. Со скромными 32 тысячами в ChatGPT Plus и сравнивать не хочется — здесь OpenAI срочно нужно улучшать положение.

К подписке Gemini Pro у меня двойственное отношение. С одной стороны, у нее один из лучших value на рынке. Например, 2.5 Pro ограничена 100 запросами в сутки — это больше, чем всего 200 запросов в неделю у конкурирующей ChatGPT o3. В подписку входят ИИ-функции в Gmail и Google Docs, 2 терабайта облачного хранилища, доступ к Jules, дополнительным функциям NotebookLM и быстрой версии Veo 3 Fast. Также отмечу Google AI Studio, где модели компании на данный момент можно использовать и вовсе бесплатно — но в обмен на данные, которые Google может использовать для дальнейшего обучения своих ИИ.

С другой стороны — сервисы Gemini намного более сырые, чем ChatGPT. У веб-интерфейса и мобильных приложений много багов, они редко обновляются, отсутствуют и многие важные функции, вроде полноценной памяти между чатами. Интересно, что команда Google AI Studio развивает свой "бесплатный" проект даже быстрее: нередки случаи, когда фичи там появлялись раньше, чем у тех, кто платит подписку. Если бы не отсутствие мобильного приложения, то я бы перешел на AI Studio.

Claude (Anthropic)

Когда весной Google и OpenAI начали выпускать обновления своих продуктов с космической скоростью, то были опасения, что Anthropic просто не поспеет за ними и вылетит из гонки. Но нет — недавно компания представила новые Claude Sonnet 4.0 (побыстрее и подешевле) и Opus 4.0 (поумнее), вновь вернувшись в начало рейтинга. Модели Claude традиционно любимы среди тех, кто использует ИИ для программирования, причем я бы отметил не только качество кода, но и "чувство прекрасного", насколько это вообще можно отнести к ИИ. Попросите разные модели ИИ сделать веб-сайт — и вариант от Claude с большой вероятностью будет лучшим.

Также отмечу качество веб-версии и приложений Claude — даже лучше, чем ChatGPT. Особенно меня впечатляет реализация режима Artifacts, где можно сразу посмотреть, как будет выглядеть, например, презентация или простенький веб-сайт.

Самый большой минус — динамические лимиты на использование. Даже оформив подписку Pro, вы не будете точно знать, сколько у вас сообщений осталось - лимит сбрасывается каждые 5 часов и может быть разным утром и вечером, в зависимости от нагрузки на серверы. Если используете Claude для работы, то всегда есть риски остаться без помощника в самый важный момент. Я уже написал выше, что считаю работу по API не очень удобной, но в случае с Claude такой вариант выглядит, возможно, предпочтительным.

Grok 3 (xAI)

Компания Илона Маска xAI быстро ворвалась на ИИ-рынок, в рекордные сроки построив суперкомпьютер Colossus и натренировав на нем модель Grok 3, которая, на момент выхода в середине февраля, оказалась одной из лучших в рейтингах. Но 4 месяца — слишком большой срок, поэтому сейчас Grok 3 уже заметно сдал позиции. Кроме того, если на старте этот ИИ был очень живым в общении, то недавно xAI зачем-то поменяли ему системный промпт, сделав модель более скучной (здесь я рассказывал, как вернуть старый промпт модели, а также — как использовать его в Gemini).

Илон Маск анонсировал Grok 3.5 еще в апреле, похваставшись, что это будет первый ИИ, способный рассуждать из первых принципов — то есть, разбираться с проблемами, решения которых нет в интернете. Проверить это утверждение пока нет возможности: выход Grok 3.5 постоянно откладывается, так как, по словам все того же Маска, модель требует дополнительной тренировки.

Я много работал с Grok 3 почти сразу после выхода, эта модель очень мне нравится, поэтому я почти полностью уверен, что Grok 3.5 также окажется мощным ИИ. Но прямо сейчас выбирать Grok 3 не стоит: он уже уступает моделям от конкурентов, кроме того, подписка SuperGrok почему-то стоит $30 против $20 у всех остальных. Но отмечу голосовой режим, который мне нравится больше, чем у конкурентов — впрочем, он доступен и на бесплатном тарифе. Также Grok 3 не очень агрессивно зацензурен — примерно на уровне Gemini, которую похвалил выше.

DeepSeek R1/V3

DeepSeek R1 наделал немало шума в январе: китайцы выпустили ИИ на уровне последних моделей ChatGPT, но бесплатный да еще и с открытым кодом. После такого все ожидали китайского чуда в лице DeepSeek R2, который и вовсе оставит конкурентов глотать пыль. Но в реальности компания в конце мая выпустила минорное обновление DeepSeek R1, лишь подтянув позиции в рейтингах.

Впрочем, даже в таком статусе DeepSeek R1 остается лучшим ИИ для тех, кто хочет просто "скачать, чтобы работало" — не нужно никакой возни с подписками и прочими барьерами. В январе-феврале бесплатность DeepSeek R1 привела к мощным проблемам с доступом, но в последние дни я такого не замечал.

Учитывайте, что DeepSeek R1 чистый ИИ, максимально ограниченный в дополнительном функционале. Здесь нет генерации картинок, голосового режима, аналога Artifacts и прочего. Так что модель хороша для старта, а как определитесь, что нужно - поймете, на кого из конкурентов переходить.

...и все остальные

Несколько слов к моделям, которым не досталось отдельной главы:

Семейство Llama-4 от Meta оказалось полным провалом, натренированным на красивые цифры в бенчмарках. Их давно уже почти не вспоминают, а Цукерберг, по некоторым данным, собирает новую команду для разработки ИИ.

Perplexity остается неплохим выбором для веб-поиска, однако поисковые функции у перечисленных выше компаний стали настолько лучше, что я им почти не пользуюсь.

Midjourney недавно обновили до 7-й версии, которая очень хороша, но ситуация та же самая: приличная генерация картинок теперь есть у ChatGPT и Gemini, так что большого смысла в отдельной подписке нет.

P.S. Поддержать меня можете подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой точки зрения.

Комментарии (9)

Kamil_GR
16.06.2025 18:43
#28443538
У меня такое ощущение, что я недавно это читал

Upd: А... Это самоцитирование вашей статьи о chatgpt 5.0

vital_pavlenko
16.06.2025 18:43
#28443854
Ставить ссылку на тг-канал в начале предложения — даже для меня перебор. Можно скромненько в конце статьи хотя бы)

Представьте флоу читателя. Он открывает статью, чтобы начать её читать. А вы его сразу в тг отправляете

Да и минусов нахватаете за такое, даже если контент полезный

Dhwtj
16.06.2025 18:43
#28443858
Llama оскандалился с накруткой рейтинга и вначале был забанен на lmarena (был в списках как deprecated) а затем рейтинг его был кастрирован свежими настройками системы оценки.

O3 pro у меня никак не получается протестировать. Говорят, он хорош для большого исходного контекста, лучше дать ему весь репозиторий.

Но в целом я всё больше разочарован. Максимум стабильно получается задача строк на 200. Пробовал задачу на 1-2 тысячи строк (парсинг со сложной логикой) - приходится самому определять типы (20 типов) и сигнатуры функций (20-30). Ну а дальше реализовать я и сам могу. Тем более, что LLM слишком часто воображают несуществующие методы в библиотеках.

dyadyaSerezha
16.06.2025 18:43
#28444672
Первая — рейтинг ИИ от ресурса LMArena.

Не вижу в рейтинге наших главных импортозаменителей, Сбер и Яндекс. Как их ИИ выглядят на фоне тех, что в рейтинге? Только без мата, плиз)
1. runaway_llm Автор
  16.06.2025 18:43
  #28445884
  Как чатботы для экосистем Яндекса и Сбера они вполне годятся. Как конкуренты ведущим LLM от мировых производителей - нет. Для тренировки передовых моделей требуются кластеры, официальная стоимость которых перевалила за миллиарды долларов, плюс мы попадаем под санкции и карты ввозятся серыми каналами, а это еще надбавка к цене.
  
  Здесь я бы ждал китайцев, которые под санкциями нас не держат. Huawei уже создал вполне рабочий Ascend 910, а на заводе компании проходит обкатку прототип EUV-сканера, который позволит достичь техпроцессов ниже 7нм. Ну а параллельно развивал энергетику - по прогнозам Альтмана и Маска, в какой-то момент возникнет ситуация, когда мощность ИИ будет эквивалентна энергии, которую мы готовы ему выделить.
  1. dyadyaSerezha
    16.06.2025 18:43
    #28445996
    А вроде как DeepSeek гораздо меньше ест ресурсов, нет?

Leadmagneet
16.06.2025 18:43
#28446038
Опеай давно не пользуюсь, но вот гемени 2.5 это вещь. И в кодинге на голову лучше клауда 4. И канвас аналог артефактов в клауда. И генерация речи и имеджген и видео.

Alfka
16.06.2025 18:43
#28447212
Это устаревший формат. У вас цены компании нет и какой прирост капитала и народа. Нет информации о новых библиотеках и или устранения количества ошибок. В целом такую стряпню читать на таком хорошем сайте не имеет смысла.

Alfka
16.06.2025 18:43
#28447232
А если нет обзора о стоимости ( падение стоимости или в случае нко - получение грантов или объём спонсорской помощи ) , то и "достижения" сомнительные ( мягко сказано ), вот.