Что ждать от Google I/O любителям ИИ / forpes.ru

Главная
Что ждать от Google I/O любителям ИИ

Что ждать от Google I/O любителям ИИ +2

17.05.2025 05:20

runaway_llm 2 2500 Источник

20-21 мая Google проведет input/output (сокращенно I/O), свое самое крупное мероприятие для разработчиков, на котором компания всегда делает множество анонсов. Очевидно, что в этом году центральной темой станет искусственный интеллект — подразделение Google DeepMind в последние месяцы успешно конкурирует с OpenAI и Anthropic, поэтому новые анонсы компании особенно интересны.

И пусть до I/O еще остается несколько дней, в сети уже полно слухов и утечек, что поклонникам ИИ стоит ждать от Google I/O. Я собрал самые интересные и достоверные.

Новые языковые модели

Казалось бы, буквально 25 марта Google выпустила свою передовую модель 2.5 Pro, за которой 17 апреля последовала более быстрая 2.5 Flash. Обе модели занимают высокие строчки в популярных бенчмарках (а 2.5 Pro и вовсе борется за лидерство), но Google не собирается останавливаться. За последние недели на сайтах вроде LMarena компания обкатала более десятка «секретных» моделей (а скорее — чекпоинтов для 2–3 моделей) с фэнтезийными названиями вроде Moonhowler, Dragontail и Stargazer. Одна из них в итоге оказалась обновленной версией 2.5 Pro, которую Google планировала представить на I/O, но в итоге выпустила на две недели ранее. Модель стала лучше в программировании (особенно для фронтенд‑ и UI‑разработки), но в других бенчмарках не продвинулась — а где‑то даже немного уступила ранней 2.5 Pro.

Сравнение результатов двух варантов Gemini 2.5 Pro в некоторых популярных бенчмарках. Видно, что обновленную версию заточили под программирование

Будут ли новые модели на самой Google I/O? Шансы есть — все-таки 13 тестовых версий вряд ли относятся только к 2.5 Pro. Во-первых, логично было бы следом обновить 2.5 Flash. Во-вторых, куда больше интриги вокруг 2.5 Ultra — фраза “continue with Ultra” недавно была добавлена в код приложения Gemini, и пусть многие ассоциируют ее с новым тарифным планом, возможность анонса новой мощной модели тоже нельзя исключать. Тем более, что для Google было бы логично подготовить конкурента ChatGPT o3-Pro, выход которой также ожидается в ближайшие недели. Наконец, с большой вероятностью мы увидим новую опенсорс-модель Gemma — она уже тестируется на LMarena под кодовым названием Cutiepie-75.

Генерация изображений и видео

У Google уже есть неплохая модель генерации изображений Imagen 3, плюс прямо сейчас компания постепенно запускает нативное редактирование изображений в приложении Gemini. Но все эти усилия пока остаются в тени великолепной генерации изображений ChatGPT. На I/O компания явно попробует наверстать упущенное: в коде Gemini уже обнаружены упоминания Imagen 3.5, 4.0 и даже 4.0 Ultra — а также модель создания видео Veo 3. Честно говоря, даже если Google просто сравняется с OpenAI в плане создания картинок - это уже будет отличный подарок всем пользователям Gemini.

А вот выход Veo 3 кому-то может показаться преждевременным — Google совсем недавно запустила для массового пользователя Veo 2, которая до сих пор находится в топе бенчмарков. Однако нынешние модели по созданию видео все еще сильно ограничены — например, Veo 2 создает ролики продолжительностью всего в 8 секунд. Так что приличный темп развития здесь может быть оправдан.

Computer Use — ИИ, управляющий вашим компьютером

Не только Gemini App является поставщиком утечек — в коде платформы для ИИ-экспериментов Google AI Studio недавно нашли упоминание Computer Use, давно обсуждавшегося ИИ-агента, который сможет управлять вашим компьютером так же, как и вы сами: делать за вас покупки в интернете, устанавливать и настраивать программы, запускать код, видеть результаты и вносить правки и так далее. Вообще агентские функции считаются одним из главных векторов развития ИИ в 2025 году и далее. И пока, честно говоря, это направление буксует — у той же OpenAI очень скромные результаты с Operator.

Не исключено, что Google не будет начинать с полноценного агента, а предложит более специализированное решение. В прессе появились данные, что компания показала ряду своих сотрудников и партнеров прототип агента для программирования. Источники утверждают, что агент полезен на всех этапах создания программного обеспечения — от работы в таск-менеджерах до написания документации.

Продвинутая память и другие изменения в Gemini App

Я сам очень люблю модели Google Gemini, но вынужден признать — приложение Gemini App, в особенности его мобильные версии, серьезно отстает от приложений ChatGPT, Claude и даже Grok. Но недавно занимающаяся Gemini App команда обновилась — и есть шансы, что приложение начнет развиваться быстрее: например, чаще стали выходить версии с исправлением багов, а на днях появилась отдельная версия для iPad.

Руководящий разработкой Gemini App Джош Вудворд в своем X недавно рассказал о планах на будущее. Главное — в Gemini App появится общая память между чатами. Аналогичную функцию недавно запустили в ChatGPT и Grok, и она открывает совершенно новый опыт взаимодействия с ИИ: изучая диалоги, нейросеть начинает лучше знать пользователя, его интересы, увлечения, какие-то любопытные события из жизни. Постепенно работа с ИИ становится все более персонализированной — например, можно попросить его предложить темы для разговора (или глубокого изучения) на основании прошлых знаний о вас. В своем телеграм-канале я приводил несколько примеров использования памяти ИИ.

Google планирует развить эту функцию даже далее — если выдать соответствующее разрешение, то Gemini включит в память историю вашего поиска в Google, ваши переписки в GMail, документы из Google Drive, события из Google Calendar, фотографии из Google Photos и так далее. Честно говоря, даже немного страшно передавать модели такие обширные знания о себе — но и интересно, как все эти данные можно использовать в работе.

Новые тарифные планы Gemini Advanced

Наконец, потенциальная новость со знаком “минус”. Google в последние месяцы отличалась щедростью к платным и бесплатным пользователям. На экспериментальной площадке Google AI Studio до недавнего времени можно было бесплатно пользоваться 2.5 Pro с лимитами, достаточными для минимум одного крупного проекта в день. Ну а 20-долларовая подписка Gemini Advanced сейчас дает практически безлимитный доступ к 2.5 Flash и Pro (есть информация о 500 запросах в сутки к каждой модели, что очень много) вместе с 20 запросами к DeepResearch (функция глубокого поиска в сети, когда модель работает 20-30 минут и создает гигантский отчет), возможностью использовать генерацию изображений и видео, а также прочими приятными мелочами вроде 2 терабайт в облачном хранилище. Причем как минимум до 20 июня подпиской Gemini Advanced еще и можно поделиться с 5 членами своей семьи.

Это очень много: например, 20-долларовая подписка ChatGPT Plus дает только 10 запросов к DeepResearch в месяц и 100 запросов к самой мощной модели o3 в неделю. И логично, что с ростом популярности Google начнет пробовать немножко прижать лимиты. Первые намеки уже появились: буквально на днях из Google AI Studio убрали бесплатный доступ к 2.5 Pro, а в Gemini Advanced я впервые столкнулся с ограничением на генерацию только пяти видео в Veo 2 в сутки. Упоминания новых тарифных планов также проскакивали в коде Gemini, поэтому есть шанс, что платить придется больше и за меньшие возможности. Но не думаю, что лимиты прижмут драматически — Google еще долго будет находиться в позиции догоняющего к OpenAI, а значит, должна чем-то завлекать пользователей.

Это вряд ли полный список: 20 мая нас ждет выход полноценного приложения для NotebookLM, плюс наверняка Google продолжит интегрировать Gemini в свою экосистему, а также покажет новые кейсы использования ИИ в науке — буквально несколько месяцев назад компания анонсировала целую агентскую систему, призванную помогать ученым. Так что не пропустите Google I/O 20 и 21 мая. А лучше подписывайтесь на мой телеграм-канал — будем следить вместе!

Комментарии (2)

Kassatsier
17.05.2025 11:34
#28316600
Почему Гугл не раскатывает свои модели на широкую аудиторию и держит за забором, отдавая долю рынка OpenAI?
1. runaway_llm Автор
  17.05.2025 11:34
  #28316638
  Раскатал уже - бесплатные лимиты у них намного выше, чем у ChatGPT (слышал о 500 запросах в день к 2.5 Flash и 25 запросах к Pro), а 20-долларовая Advanced-подписка практически безлимитная. И в целом активно работают над привлечением - предлагают бесплатный месяц, на днях вот запустили акцию с четырьмя бесплатными месяцами по реферальной ссылке от существующего пользователя.
  
  Хитрость скорее в том, что ChatGPT еще долго будет чем-то вроде Xerox для AI - я постоянно интересуюсь у совершенно разных людей, как они используют ИИ, и вижу, что в 80% случаев пользуются именно ChatGPT и даже не представляют, что есть другие модели. Полагаю, Google здесь нужно привлекать аудиторию через другие свои сервисы, вроде поиска (AI-поиск уже тестово запущен в США) или тех же документов. xAI от Илона Маска очень успешно интегрировала Grok как сервис для быстрых справок ответов в X. В OpenAI кстати тоже поговаривают о своей соцсети, понимая, что одним ИИ-сервисом не ограничишься.