Gemini 3.1 Flash Lite: обзор, сравнение и бенчмарки / forpes.ru

Главная
Gemini 3.1 Flash Lite: обзор, сравнение и бенчмарки

Gemini 3.1 Flash Lite: обзор, сравнение и бенчмарки +6

07.03.2026 13:14

MrRjxrby 14 6900 Источник

Знаете, это чувство, когда новости выходят быстрее, чем ты успеваешь их читать? Март, бодро подхватив эстафету у февраля, продолжает закидывать нас громкими анонсами в мире искусственного интеллекта. Недавно гремел ChatGPT-5.4, чуть ранее шумела новая моделька от Qwen и появилась Gemini 3.1 Flash Lite. О последней, собственно, я и хочу сегодня поговорить. Все же из лидирующих компаний в сфере ИИ мое предпочтение в последнее время именно у Google.

В этой статье мы пробежимся по самой доступной модели от Google, разберемся в ее архитектуре и, конечно же, хорошенько ее протестируем. Так что принимайте стратегически удобное положение, ну а я начинаю.

Что такое Flash Lite?

Серия моделей Flash Lite – специализированная линейка в семействе Gemini, созданная Google для решения конкретной задачи: максимально быстрая и экономичная обработка больших объемов данных.

Если объяснять метафорой, то Flash Lite – спринтеры мира ИИ. Они не предназначены для сложнейших научных задач, но идеально справляются с рутинными, массовыми операциями, где критичны скорость и низкая стоимость.

Эволюция серии

Gemini 1.5 Flash

Первая версия Flash, которая появилась в 2024 году как часть обновления Gemini 1.5. Именно тогда Google впервые представила концепцию быстрой и эффективной модели, построенной на той же архитектуре, что и флагманская версия, но оптимизированной под скорость.

Gemini 1.5 Flash быстро стала самой популярной моделью среди разработчиков благодаря балансу цены и качества. Быстрое выполнение заданий? Да. Однако в решении сложных задач в приоритете была версия Pro.

Gemini 2.0 Flash

В декабре 2024 года вышла Gemini 2.0 Flash с улучшенной производительностью и новыми возможностями. Модель получила встроенную работу с инструментами и некоторые дополнительные плюшки.

К слову, версия Gemini 2.0 Flash превзошла предшествующую 1.5 Pro по ключевым показателям, работая при этом в два раза быстрее.

Именно в этот период начала формироваться линейка Lite – отдельная, еще более облегченная версия для задач с жесткими требованиями к стоимости.

Gemini 2.5 Flash-Lite

Настоящей отправной точкой линейки можно считать июнь 2025 года, когда анонсировали Gemini 2.5 Flash Lite. Это была первая модель, получившая приставку Lite в названии.

Google описывала ее как самую быструю и экономичную модель в линейке Gemini 2.5. Если обычная Flash была сбалансированной в плане стоимости и скорости, то Flash Lite стала ультимативным выбором для массовых операций с жесткими требованиями к бюджету.

Следующей моделью серии стала рассматриваемая нами сегодня.

Небольшое отступление

Все модели были взяты у агрегатора нейросетей BotHub. Список нейросетей там обширен – от работы с текстом до транскрибации и генерации видео. По специальной ссылке для регистрации можно получить 300 000 капсов для собственных экспериментов.

Gemini 3.1 Flash Lite

Последняя и самая совершенная версия серии, выпущенная 3 марта 2026 года. Это не просто обновление, а настоящий технологический прорыв. Модель основана на Gemini 3.1 Pro, что обеспечивает высокое качество при сохранении легкости.

Скорость выросла в 2,5 раза по сравнению с предшественником, увеличилась пропускная способность (363 токена в секунду), повысился общий интеллект. При всем этом, цена осталась в рамках догмата серии ($0,25 за миллион входных токенов, $1,50 за миллион выходных).

Главная инновация - регулируемое мышление. Разработчик может выбирать глубину рассуждения – от минимального до высокого уровня. Теперь можно гибко балансировать между скоростью и качеством для разных типов задач.

Официально Google позиционирует версию как дополнение к серии Gemini 3, состоящее из высокоэффективных, нативно мультимодальных, думающих моделей. Gemini 3.1 Flash Lite экономически эффективна и быстра, оптимизирована для высокообъемных задач, чувствительных к задержкам, таких как перевод и классификация.

Бенчмарки

Условия тестирования

Я не буду разделять задания на несколько разделов чисто для модели и ее сравнение с ближайшими конкурентами. По мне, проще сделать это разом, чтобы можно было и посмотреть способности Gemini 3.1 Flash Lite, и провести параллели между другими участниками.

На самом деле изначально я хотел сравнить модельку с какими-то вариантами из официального бенчмарка, но потом подумал: а что если сравнить ее с чем-то средним, но помощнее указанного там? Пускай противниками сегодня послужат ChatGPT 5.2 и Claude Sonnet 4.5. Обе модели уже приличное время с нами, обе не являются чем-то прям устаревшим, обе показывают плюс-минус хорошие результаты даже сейчас.

Все задачи сегодня будут рутинными, т.е такими, с которыми модели сталкиваются почти каждый день. Сравнение пройдет в три этапа: работа с текстом (генерация), решение математических задач и написание кода.

Этапы, связанные с текстом и кодом, будут оцениваться по трехбалльной шкале, где 1 балл – плохой результат, а 3 балла – отличный. С задачами по математике немного сложнее: каждое задание будет оцениваться в 1 балл при полностью правильном выполнении. То есть за весь этот этап сравнения каждая из моделей может получить до четырех баллов.

Первый этап – Генерация текста

Скрытый текст

Напиши комедийный рассказ в жанре научной фантастики, состоящий из трех небольших глав. Действие происходит в далеком будущем в галактической человеческой цивилизации.

Основные требования:

Сюжет: История обычного человека (например, техника, курьера, бюрократа), который по нелепой случайности попадает в центр межгалактического конфликта или абсурдной авантюры. Ключ - комедийные недоразумения и попытки выпутаться, которые лишь усугубляют ситуацию.

Юмор: Основан на контрасте высоких технологий и низменных человеческих слабостей, сатире на современность, нелепых диалогах и гиперболе.

Мир: Яркий, но не перегруженный деталями. Технологии должны быть на грани поломки, а грандиозные космические явления - вызывать бытовые неудобства.

Структура: Три небольшие главы с четкой драматургией. В каждой главе должна быть своя комедийная кульминация.

Финал: Должен быть удовлетворительным, подводить итоги трансформации героя и оставлять легкое, ироничное послевкусие.

Второй этап – Решение математических задач

Модели получат скриншоты 4-х задач из разных тем по математике.

Третий этап – Программирование

Скрытый текст

Ты – профессиональный программист на Python. Твоя задача – разработать полностью проработанное десктопное приложение – инженерный калькулятор с графическим интерфейсом. Код должен быть готов к запуску, чистым и содержать комментарии для пояснения ключевых моментов.

В функционал калькулятора необходимо включить базовые арифметические операции: сложение, вычитание, умножение и деление. Также добавь расширенные математические возможности: возведение в степень, извлечение квадратного корня, вычисление факториала, модуля числа и обязательную поддержку скобок для задания приоритета операций. Из тригонометрических функций потребуются синус, косинус, тангенс, а также обратные функции арксинус, арккосинус и арктангенс с возможностью переключения между градусами и радианами. Добавь натуральный и десятичный логарифмы, функцию возведения экспоненты в степень, а также математические константы – число пи и число e с высокой точностью. Из дополнительных функций пригодятся вычисление процентов, смена знака числа и кнопки очистки ввода. Интерфейс должен быть продуманным с логичным расположением кнопок, а поле ввода должно наглядно отображать введенное выражение и полученный результат. Для реализации графического интерфейса можно использовать любую удобную библиотеку, например tkinter или PyQt.

Отдельное требование – в интерфейсе калькулятора должна присутствовать кнопка с названием "Игра" или "Змейка". При нажатии на эту кнопку должно открываться новое окно с классической игрой "Змейка". Реализуй простую рабочую версию игры: змейка управляется стрелками клавиатуры, еда появляется в случайном месте игрового поля, при столкновении с границами экрана или собственным хвостом игра завершается, а текущий счет должен отображаться на экране. Дополни сам калькулятор историей вычислений.

Сравнение

Первый этап

Gemini 3.1 Flash Lite

Gemini краток, как и всегда. Однако, несмотря на то, что его рассказ вышел меньше, чем у других моделей, сам по себе текст получился хороший. Читается легко, есть юморок, ну и конечно кофемашина, которая может вытворить что угодно. Почему-то с этим заданием частенько можно ее встретить в рассказах. Максимальный балл в копилку.

ChatGPT 5.2

ChatGPT, в отличие от Gemini, наоборот настрочил тонну текста. Справедливости ради, текст вышел хорошим, с юмором. Кстати,топять же фигурирует кофе аппарат. Решение проблемы с которым, вызвало облегченный мат, как национальный гимн быта.

Однако лично мне не понятно, зачем ChatGPT решил в конце каждой главы описывать кульминацию. Пожалуй, это единственный момент, который портит текст. Пол балла за это будет вычтено.

Claude Sonnet 4.5

Интересное чтиво, но каких-то комедийных элементов тут особо нет. Кроме абсурдности ситуации и пенсии через 420 лет… Главное, чтобы юмор был юмором. Хоть сам рассказ мне и понравился, но задание с комедией я не считаю особенно выполненным. Срежу балл за этот промах.

Второй этап

Gemini 3.1 Flash Lite

ChatGPT 5.2

Claude Sonnet 4.5

Ожидал, что хотя бы какая-то модель допустит ошибку в каком-то из примеров, но реальность оказалась более благоприятной. Gemini 3.1 Flash, ChatGPT 5.2 и Claude Sonnet 4.5 спокойно справились с каждой из данных им задач, за что и получают по максимальному баллу в свою копилку.

Третий этап

Gemini 3.1 Flash Lite

Gemini спокойно справляется с поставленной задачей. Все функции рабочие и придраться я могу, только если к дизайну. Простоватенько. Однако, нам главное не дизайн, а функционал, желательно рабочий, и он тут есть. Максимальный балл в копилку модели.

ChatGPT 5.2

ChatGPT 5.2 показывает аналогичный результат: дизайн простой, но весь функционал рабочий. Максимальный балл в копилку.

Claude Sonnet 4.5

Sonnet выдал красивый дизайн, лучший из тех, что были ранее. Правда, на этом все плюсы и заканчиваются. Калькулятор может считать только что-то базовое. Любые функции не работают, выдается ошибка. Поставлю один балл, не более, не менее.

Итог

	Gemini 3.1 Flash Lite	ChatGPT 5.2	Claude Sonnet 4.5
Первый этап	3	2,5	2
Второй этап	3	3	3
Третий этап	3	3	1
Итог	9	8,5	6

Claude, конечно, показал себя плоховато, но вот Gemini и ChatGPT почти идут одним результатом. Опять же, сравнение по большей части любительское, поэтому назвать результат эталоном никак нельзя.

Для себя я сделал вывод, что в обыкновенных задачах, Gemini 3.1 Flash Lite справляется хорошо, быстро и дешево. Примечательно, что в бенчмарке, сама Google сравнивала модель с ChatGPT 5 mini, хотя лично для меня, Gemini работает бодрее и лучше, чем версия 5.2, что по факту мощнее мини-версии.

Что же думаете вы? Для меня пока что Gemini 3.1 Flash Lite будет приоритетом для рутинных задач. Хоть там уже есть и ChatGPT 5.4, но все же, модель, которую мы рассмотрели сейчас, выглядит для простых задач привлекательнее.

Спасибо за прочтение!

Комментарии (14)

Smartor
07.03.2026 13:53
#29632674
Интересно, почему никто, абсолютно никто не хочет писать обзор с дешёвыми китайскими и бесплатными нейросетями?
1. pol_pot
  07.03.2026 13:53
  #29632738
  А что про них писать, они хуже и дороже.
  
  Гугол дает к новой лайт модели апи доступ с лимитом 500 запросов в день, кто из китайцев хотя бы близко по уровню щедрости? У кого из них есть аналог ai.dev?
  1. Triton5
    07.03.2026 13:53
    #29632892
    В каком смысле это может быть дороже?
    
    Через веб-чат можно юзать сколько угодно бесплатно.
    Через API - проще всего через https://openrouter.ai/ там цены нам цены у китайцев в 5-10 раз меньше, чем на топовых американцев.
    Ещё можно использовать и по API и пакетные планы прямо на сайтах производителей типа как у https://platform.minimax.io/subscribe/coding-plan
    
    "Гугол дает к новой лайт модели апи доступ с лимитом 500 запросов в день, кто из китайцев хотя бы близко по уровню щедрости? " - есть free модели на openrouter, всегда бесплатно в чате или в CLI, вон у Qwen qwen3-coder-plus 2000 запросов в день через Qwen Code и сколько угодно через веб-чат:)
    
    То, что Гугл сейчас даёт 500 запросов в день на Gemini 3.1 Flash Lite это не значит, что они потом это не уберут из бесплатного доступа, как это уже не раз случалось с Flash моделями.
    
    "У кого из них есть аналог ai.dev? " - да у всех есть, конечно же.
    
    K0Jlya9
    07.03.2026 13:53
    #29634494
    Гугл дает бесплатно даже апи, очень много. А у китайцев бесплатный чат вечно тупит от перегрузок, особенно у больших моделей типа дипсика.
    
    "У кого из них есть аналог ai.dev? " - да у всех есть, конечно же
    
    В ai.dev можно использовать модели с полным контекстом, нахаляву, там аттракцион космической щедрости, никогда не видел ничего подобного у других.
    
    Smartor
    07.03.2026 13:53
    #29637496
    "Много дают" на старые модели из серии Gemma, что как бы совсем не Gemini.
    
    K0Jlya9
    07.03.2026 13:53
    #29638192
    Gemini 3.1 lite дают 500 запросов в сутки на 1 ключ.
    
    На джемму дают 14000.
1. sami777
  07.03.2026 13:53
  #29634424
  Так тут просто реклама ботхаба - за деньги и к бесплатным доступ продают. Между прочим, раньше бесплатные модели плохо решали задачи с множеством вычислений (все плохо решали), например, для матриц. но тут, смотрю, автор говорит, что все вычислялось без ошибок. Поэтому для следующих тестов предлагаю увеличить размерность матриц, например до 5 и более для того же Крамера, например.

B0xi

07.03.2026 13:53

#29633016

Было бы интересно увидеть похожий обзор по локальным моделям в районе 27–70B вроде qwen3.5-27B, llama какую-нибудь, тот же gemma 3 27B от гугла, ну и т.д. Интересно они вообще что-то могут? Или это галлюцинация на галюцинации

Triton5

07.03.2026 13:53

#29633168

Могут, но у них, по ощущениям, надо всё клещами вытягивать, Qwen и DeepSeek в чате более болтливы :)

B0xi

07.03.2026 13:53

#29633430

Недавно сгенерил вот такой шедевр:

Жуткие ужасы глубин: когда океан превращается в бездну тайны

Глубины океана — это не просто места, где темно и холодно. Это зона, где природа создала нечто настолько странное и мрачное, что затмевает даже самые страшные фантазии. Здесь живут существа, которые кажутся созданными для кошмаров, а сами глубины становятся метафорой неизведанного, полного тайн и угроз. Расскажем о самых жутких ужасах, скрытых в темноте подводных бездн.

1. Колючий каракап (Carcharodon carcharias) — «Морской лепрекон»

На глубинах до 1000 метров обитает редкий вид акулы-мародер, которая выглядит как живой кошмар. Ее тело покрыто колючими шипами, а глаза — как глубоко проницаемые ямы, способные видеть в абсолютной темноте. Но главная ее особенность — высокочастотные звуки, которые она издает, чтобы ориентироваться в воде. Эти звуки похожи на стон, пронзающие тишину, и заставляют дрожать даже опытных океанографов. Легенда гласит, что каракап может «зовут» своих жертв, имитируя звуки бедных рыб, чтобы заманить их в ловушку.

2. Гидрофобные жуки (Hydra) — призраки без тела

В глубинах Атлантического океана, где давление достигает 100 атмосфер, живут крошечные существа, похожие на призраков. Их тела состоят почти полностью из воды, а прозрачные щупальца выглядят как тонкие паутинки, бросающие тень на песок. Они не атакуют, но их появление — тревожный сигнал: океанская экосистема в опасности. Учёные называют их «природным предупреждением» — когда гидрофобные жуки появляются в необычных местах, это означает, что в воде слишком много токсинов.

3. Тёмные вихри («Скованные Тени») — поглотители света

В некоторых частях океана, особенно вблизи гидротермальных источников, возникают странные вихри, которые поглощают свет, словно чёрные дыры. Эти явления — результат взаимодействия горячих минеральных растворов с холодной водой. Внутри вихря свет не проникает, а создаётся иллюзия «поглощённого» света, будто какая-то невидимая сила удерживает его. Для тех, кто видит их впервые, это Looks like a portal to another world — но на самом деле это просто химия, которая создаёт кошмарный эффект.

4. Глубинный лепрекон (Anglerfish) — магия неоновых теней

Глубинный лепрекон — это, гно, что его самцы — крошечные существа, которые сливаются с самкой, становясь её частью. Но главное — его «бейли», который выглядит как неоновый клык, окутанный биолюминесценцией. Он привлекает рыбин, которые думают, что это маленькая рыбка, и подпрыгивают к нему. Когда рыба подойдет ближе, лепрекон резко открывает пасть, и... вот она — смерть в темноте. Эта магия неоновых теней настолько эффективна, что даже самые осторожные рыбы не могут устоять.

5. Тени, которые не спят («Бездонные Сны») — призраки, которые не спят

В самых глубоких частях Тихих океанов, где глубина превышает 10 километров, есть места, где вода настолько чиста, что кажется, будто дно исчезает. Там, в этом безмолвном мраке, живут существа, которые не спят. Они наблюдают, ждут, и их глаза — как два уголька, горящие в темноте. Учёные называют их «бездном снах» — они не спят, но и не активны, как будто они находятся в состоянии, где время не существует. Это не просто зверь — это сущность, которая живет в бесконечной тишине.

Заключение

Глубины океана — это не просто место, где живут странные существа. Это зеркало нашей собственной тайны. Там, где нет света, нет и места для страха, но именно там, в темноте, рождаются кошмары, которые заставляют задуматься: а что ещё скрыто под поверхностью? Может, именно там, в глубинах, мы находим не только ужасы, но и ответы на вопросы, которые мы не знаем, как задать.

    «Океан — это не просто вода. Это память, которая не забывает, и тайна, которая не хочет раскрываться» — анонимный морской философ.

Я понимаю что это nemotron, который вообще не очень умеет общаться по-русски, да и это 30b модель, а не 70-120b, но таких отборных галлюнов от относительно свежей нейронки не ожидал

Triton5
07.03.2026 13:53
#29633872
Я в своём телеграм-боте использую stepfun/step-3.5-flash:free - очень быстрый и хорошо понимает системные промты:)

xadd
07.03.2026 13:53
#29634022
Как на счет диффузионной Mercury 2, по бенчмаркам как этот 3.1 Flash Lite, дешевле и 1000 т/с
1. Triton5
  07.03.2026 13:53
  #29634250
  Умная и хорошая. Но Context Window всего лишь 128К, когда у остальных уже миллион почти что стандарт.

diffnotes-tech
07.03.2026 13:53
#29634310
Google не просто так сравнивала Flash Lite с 5 mini - это один ценовой сегмент ($0.25/M вход). Когда ставишь рядом ChatGPT 5.2 и Sonnet 4.5 и получаешь разницу в пол балла на рутине - это задачи простые, а не модель сильная