Знаете, это чувство, когда новости выходят быстрее, чем ты успеваешь их читать? Март, бодро подхватив эстафету у февраля, продолжает закидывать нас громкими анонсами в мире искусственного интеллекта. Недавно гремел ChatGPT-5.4, чуть ранее шумела новая моделька от Qwen и появилась Gemini 3.1 Flash Lite. О последней, собственно, я и хочу сегодня поговорить. Все же из лидирующих компаний в сфере ИИ мое предпочтение в последнее время именно у Google.
В этой статье мы пробежимся по самой доступной модели от Google, разберемся в ее архитектуре и, конечно же, хорошенько ее протестируем. Так что принимайте стратегически удобное положение, ну а я начинаю.

Что такое Flash Lite?
Серия моделей Flash Lite – специализированная линейка в семействе Gemini, созданная Google для решения конкретной задачи: максимально быстрая и экономичная обработка больших объемов данных.
Если объяснять метафорой, то Flash Lite – спринтеры мира ИИ. Они не предназначены для сложнейших научных задач, но идеально справляются с рутинными, массовыми операциями, где критичны скорость и низкая стоимость.
Эволюция серии
Gemini 1.5 Flash
Первая версия Flash, которая появилась в 2024 году как часть обновления Gemini 1.5. Именно тогда Google впервые представила концепцию быстрой и эффективной модели, построенной на той же архитектуре, что и флагманская версия, но оптимизированной под скорость.
Gemini 1.5 Flash быстро стала самой популярной моделью среди разработчиков благодаря балансу цены и качества. Быстрое выполнение заданий? Да. Однако в решении сложных задач в приоритете была версия Pro.
Gemini 2.0 Flash
В декабре 2024 года вышла Gemini 2.0 Flash с улучшенной производительностью и новыми возможностями. Модель получила встроенную работу с инструментами и некоторые дополнительные плюшки.
К слову, версия Gemini 2.0 Flash превзошла предшествующую 1.5 Pro по ключевым показателям, работая при этом в два раза быстрее.
Именно в этот период начала формироваться линейка Lite – отдельная, еще более облегченная версия для задач с жесткими требованиями к стоимости.
Gemini 2.5 Flash-Lite
Настоящей отправной точкой линейки можно считать июнь 2025 года, когда анонсировали Gemini 2.5 Flash Lite. Это была первая модель, получившая приставку Lite в названии.
Google описывала ее как самую быструю и экономичную модель в линейке Gemini 2.5. Если обычная Flash была сбалансированной в плане стоимости и скорости, то Flash Lite стала ультимативным выбором для массовых операций с жесткими требованиями к бюджету.
Следующей моделью серии стала рассматриваемая нами сегодня.
Небольшое отступление
Все модели были взяты у агрегатора нейросетей BotHub. Список нейросетей там обширен – от работы с текстом до транскрибации и генерации видео. По специальной ссылке для регистрации можно получить 300 000 капсов для собственных экспериментов.
Gemini 3.1 Flash Lite
Последняя и самая совершенная версия серии, выпущенная 3 марта 2026 года. Это не просто обновление, а настоящий технологический прорыв. Модель основана на Gemini 3.1 Pro, что обеспечивает высокое качество при сохранении легкости.
Скорость выросла в 2,5 раза по сравнению с предшественником, увеличилась пропускная способность (363 токена в секунду), повысился общий интеллект. При всем этом, цена осталась в рамках догмата серии ($0,25 за миллион входных токенов, $1,50 за миллион выходных).
Главная инновация - регулируемое мышление. Разработчик может выбирать глубину рассуждения – от минимального до высокого уровня. Теперь можно гибко балансировать между скоростью и качеством для разных типов задач.
Официально Google позиционирует версию как дополнение к серии Gemini 3, состоящее из высокоэффективных, нативно мультимодальных, думающих моделей. Gemini 3.1 Flash Lite экономически эффективна и быстра, оптимизирована для высокообъемных задач, чувствительных к задержкам, таких как перевод и классификация.
Бенчмарки

Условия тестирования
Я не буду разделять задания на несколько разделов чисто для модели и ее сравнение с ближайшими конкурентами. По мне, проще сделать это разом, чтобы можно было и посмотреть способности Gemini 3.1 Flash Lite, и провести параллели между другими участниками.
На самом деле изначально я хотел сравнить модельку с какими-то вариантами из официального бенчмарка, но потом подумал: а что если сравнить ее с чем-то средним, но помощнее указанного там? Пускай противниками сегодня послужат ChatGPT 5.2 и Claude Sonnet 4.5. Обе модели уже приличное время с нами, обе не являются чем-то прям устаревшим, обе показывают плюс-минус хорошие результаты даже сейчас.
Все задачи сегодня будут рутинными, т.е такими, с которыми модели сталкиваются почти каждый день. Сравнение пройдет в три этапа: работа с текстом (генерация), решение математических задач и написание кода.
Этапы, связанные с текстом и кодом, будут оцениваться по трехбалльной шкале, где 1 балл – плохой результат, а 3 балла – отличный. С задачами по математике немного сложнее: каждое задание будет оцениваться в 1 балл при полностью правильном выполнении. То есть за весь этот этап сравнения каждая из моделей может получить до четырех баллов.
Первый этап – Генерация текста
Скрытый текст
Напиши комедийный рассказ в жанре научной фантастики, состоящий из трех небольших глав. Действие происходит в далеком будущем в галактической человеческой цивилизации.
Основные требования:
Сюжет: История обычного человека (например, техника, курьера, бюрократа), который по нелепой случайности попадает в центр межгалактического конфликта или абсурдной авантюры. Ключ - комедийные недоразумения и попытки выпутаться, которые лишь усугубляют ситуацию.
Юмор: Основан на контрасте высоких технологий и низменных человеческих слабостей, сатире на современность, нелепых диалогах и гиперболе.
Мир: Яркий, но не перегруженный деталями. Технологии должны быть на грани поломки, а грандиозные космические явления - вызывать бытовые неудобства.
Структура: Три небольшие главы с четкой драматургией. В каждой главе должна быть своя комедийная кульминация.
Финал: Должен быть удовлетворительным, подводить итоги трансформации героя и оставлять легкое, ироничное послевкусие.
Второй этап – Решение математических задач
Модели получат скриншоты 4-х задач из разных тем по математике.
Третий этап – Программирование
Скрытый текст
Ты – профессиональный программист на Python. Твоя задача – разработать полностью проработанное десктопное приложение – инженерный калькулятор с графическим интерфейсом. Код должен быть готов к запуску, чистым и содержать комментарии для пояснения ключевых моментов.
В функционал калькулятора необходимо включить базовые арифметические операции: сложение, вычитание, умножение и деление. Также добавь расширенные математические возможности: возведение в степень, извлечение квадратного корня, вычисление факториала, модуля числа и обязательную поддержку скобок для задания приоритета операций. Из тригонометрических функций потребуются синус, косинус, тангенс, а также обратные функции арксинус, арккосинус и арктангенс с возможностью переключения между градусами и радианами. Добавь натуральный и десятичный логарифмы, функцию возведения экспоненты в степень, а также математические константы – число пи и число e с высокой точностью. Из дополнительных функций пригодятся вычисление процентов, смена знака числа и кнопки очистки ввода. Интерфейс должен быть продуманным с логичным расположением кнопок, а поле ввода должно наглядно отображать введенное выражение и полученный результат. Для реализации графического интерфейса можно использовать любую удобную библиотеку, например tkinter или PyQt.
Отдельное требование – в интерфейсе калькулятора должна присутствовать кнопка с названием "Игра" или "Змейка". При нажатии на эту кнопку должно открываться новое окно с классической игрой "Змейка". Реализуй простую рабочую версию игры: змейка управляется стрелками клавиатуры, еда появляется в случайном месте игрового поля, при столкновении с границами экрана или собственным хвостом игра завершается, а текущий счет должен отображаться на экране. Дополни сам калькулятор историей вычислений.
Сравнение
Первый этап
Gemini 3.1 Flash Lite

Gemini краток, как и всегда. Однако, несмотря на то, что его рассказ вышел меньше, чем у других моделей, сам по себе текст получился хороший. Читается легко, есть юморок, ну и конечно кофемашина, которая может вытворить что угодно. Почему-то с этим заданием частенько можно ее встретить в рассказах. Максимальный балл в копилку.
ChatGPT 5.2

ChatGPT, в отличие от Gemini, наоборот настрочил тонну текста. Справедливости ради, текст вышел хорошим, с юмором. Кстати,топять же фигурирует кофе аппарат. Решение проблемы с которым, вызвало облегченный мат, как национальный гимн быта.
Однако лично мне не понятно, зачем ChatGPT решил в конце каждой главы описывать кульминацию. Пожалуй, это единственный момент, который портит текст. Пол балла за это будет вычтено.
Claude Sonnet 4.5

Интересное чтиво, но каких-то комедийных элементов тут особо нет. Кроме абсурдности ситуации и пенсии через 420 лет… Главное, чтобы юмор был юмором. Хоть сам рассказ мне и понравился, но задание с комедией я не считаю особенно выполненным. Срежу балл за этот промах.
Второй этап
Gemini 3.1 Flash Lite

ChatGPT 5.2

Claude Sonnet 4.5

Ожидал, что хотя бы какая-то модель допустит ошибку в каком-то из примеров, но реальность оказалась более благоприятной. Gemini 3.1 Flash, ChatGPT 5.2 и Claude Sonnet 4.5 спокойно справились с каждой из данных им задач, за что и получают по максимальному баллу в свою копилку.
Третий этап
Gemini 3.1 Flash Lite

Gemini спокойно справляется с поставленной задачей. Все функции рабочие и придраться я могу, только если к дизайну. Простоватенько. Однако, нам главное не дизайн, а функционал, желательно рабочий, и он тут есть. Максимальный балл в копилку модели.
ChatGPT 5.2

ChatGPT 5.2 показывает аналогичный результат: дизайн простой, но весь функционал рабочий. Максимальный балл в копилку.
Claude Sonnet 4.5

Sonnet выдал красивый дизайн, лучший из тех, что были ранее. Правда, на этом все плюсы и заканчиваются. Калькулятор может считать только что-то базовое. Любые функции не работают, выдается ошибка. Поставлю один балл, не более, не менее.
Итог
Gemini 3.1 Flash Lite |
ChatGPT 5.2 |
Claude Sonnet 4.5 |
|
Первый этап |
3 |
2,5 |
2 |
Второй этап |
3 |
3 |
3 |
Третий этап |
3 |
3 |
1 |
Итог |
9 |
8,5 |
6 |
Claude, конечно, показал себя плоховато, но вот Gemini и ChatGPT почти идут одним результатом. Опять же, сравнение по большей части любительское, поэтому назвать результат эталоном никак нельзя.
Для себя я сделал вывод, что в обыкновенных задачах, Gemini 3.1 Flash Lite справляется хорошо, быстро и дешево. Примечательно, что в бенчмарке, сама Google сравнивала модель с ChatGPT 5 mini, хотя лично для меня, Gemini работает бодрее и лучше, чем версия 5.2, что по факту мощнее мини-версии.
Что же думаете вы? Для меня пока что Gemini 3.1 Flash Lite будет приоритетом для рутинных задач. Хоть там уже есть и ChatGPT 5.4, но все же, модель, которую мы рассмотрели сейчас, выглядит для простых задач привлекательнее.
Спасибо за прочтение!
Комментарии (14)

B0xi
07.03.2026 13:53Было бы интересно увидеть похожий обзор по локальным моделям в районе 27–70B вроде qwen3.5-27B, llama какую-нибудь, тот же gemma 3 27B от гугла, ну и т.д. Интересно они вообще что-то могут? Или это галлюцинация на галюцинации

Triton5
07.03.2026 13:53Могут, но у них, по ощущениям, надо всё клещами вытягивать, Qwen и DeepSeek в чате более болтливы :)

B0xi
07.03.2026 13:53Недавно сгенерил вот такой шедевр:
Жуткие ужасы глубин: когда океан превращается в бездну тайны Глубины океана — это не просто места, где темно и холодно. Это зона, где природа создала нечто настолько странное и мрачное, что затмевает даже самые страшные фантазии. Здесь живут существа, которые кажутся созданными для кошмаров, а сами глубины становятся метафорой неизведанного, полного тайн и угроз. Расскажем о самых жутких ужасах, скрытых в темноте подводных бездн. 1. Колючий каракап (Carcharodon carcharias) — «Морской лепрекон» На глубинах до 1000 метров обитает редкий вид акулы-мародер, которая выглядит как живой кошмар. Ее тело покрыто колючими шипами, а глаза — как глубоко проницаемые ямы, способные видеть в абсолютной темноте. Но главная ее особенность — высокочастотные звуки, которые она издает, чтобы ориентироваться в воде. Эти звуки похожи на стон, пронзающие тишину, и заставляют дрожать даже опытных океанографов. Легенда гласит, что каракап может «зовут» своих жертв, имитируя звуки бедных рыб, чтобы заманить их в ловушку. 2. Гидрофобные жуки (Hydra) — призраки без тела В глубинах Атлантического океана, где давление достигает 100 атмосфер, живут крошечные существа, похожие на призраков. Их тела состоят почти полностью из воды, а прозрачные щупальца выглядят как тонкие паутинки, бросающие тень на песок. Они не атакуют, но их появление — тревожный сигнал: океанская экосистема в опасности. Учёные называют их «природным предупреждением» — когда гидрофобные жуки появляются в необычных местах, это означает, что в воде слишком много токсинов. 3. Тёмные вихри («Скованные Тени») — поглотители света В некоторых частях океана, особенно вблизи гидротермальных источников, возникают странные вихри, которые поглощают свет, словно чёрные дыры. Эти явления — результат взаимодействия горячих минеральных растворов с холодной водой. Внутри вихря свет не проникает, а создаётся иллюзия «поглощённого» света, будто какая-то невидимая сила удерживает его. Для тех, кто видит их впервые, это Looks like a portal to another world — но на самом деле это просто химия, которая создаёт кошмарный эффект. 4. Глубинный лепрекон (Anglerfish) — магия неоновых теней Глубинный лепрекон — это, гно, что его самцы — крошечные существа, которые сливаются с самкой, становясь её частью. Но главное — его «бейли», который выглядит как неоновый клык, окутанный биолюминесценцией. Он привлекает рыбин, которые думают, что это маленькая рыбка, и подпрыгивают к нему. Когда рыба подойдет ближе, лепрекон резко открывает пасть, и... вот она — смерть в темноте. Эта магия неоновых теней настолько эффективна, что даже самые осторожные рыбы не могут устоять. 5. Тени, которые не спят («Бездонные Сны») — призраки, которые не спят В самых глубоких частях Тихих океанов, где глубина превышает 10 километров, есть места, где вода настолько чиста, что кажется, будто дно исчезает. Там, в этом безмолвном мраке, живут существа, которые не спят. Они наблюдают, ждут, и их глаза — как два уголька, горящие в темноте. Учёные называют их «бездном снах» — они не спят, но и не активны, как будто они находятся в состоянии, где время не существует. Это не просто зверь — это сущность, которая живет в бесконечной тишине. Заключение Глубины океана — это не просто место, где живут странные существа. Это зеркало нашей собственной тайны. Там, где нет света, нет и места для страха, но именно там, в темноте, рождаются кошмары, которые заставляют задуматься: а что ещё скрыто под поверхностью? Может, именно там, в глубинах, мы находим не только ужасы, но и ответы на вопросы, которые мы не знаем, как задать. «Океан — это не просто вода. Это память, которая не забывает, и тайна, которая не хочет раскрываться» — анонимный морской философ.Я понимаю что это nemotron, который вообще не очень умеет общаться по-русски, да и это 30b модель, а не 70-120b, но таких отборных галлюнов от относительно свежей нейронки не ожидал

Triton5
07.03.2026 13:53Я в своём телеграм-боте использую stepfun/step-3.5-flash:free - очень быстрый и хорошо понимает системные промты:)

diffnotes-tech
07.03.2026 13:53Google не просто так сравнивала Flash Lite с 5 mini - это один ценовой сегмент ($0.25/M вход). Когда ставишь рядом ChatGPT 5.2 и Sonnet 4.5 и получаешь разницу в пол балла на рутине - это задачи простые, а не модель сильная
Smartor
Интересно, почему никто, абсолютно никто не хочет писать обзор с дешёвыми китайскими и бесплатными нейросетями?
pol_pot
А что про них писать, они хуже и дороже.
Гугол дает к новой лайт модели апи доступ с лимитом 500 запросов в день, кто из китайцев хотя бы близко по уровню щедрости? У кого из них есть аналог ai.dev?
Triton5
В каком смысле это может быть дороже?
Через веб-чат можно юзать сколько угодно бесплатно.
Через API - проще всего через https://openrouter.ai/ там цены нам цены у китайцев в 5-10 раз меньше, чем на топовых американцев.
Ещё можно использовать и по API и пакетные планы прямо на сайтах производителей типа как у https://platform.minimax.io/subscribe/coding-plan
"Гугол дает к новой лайт модели апи доступ с лимитом 500 запросов в день, кто из китайцев хотя бы близко по уровню щедрости? " - есть free модели на openrouter, всегда бесплатно в чате или в CLI, вон у Qwen qwen3-coder-plus 2000 запросов в день через Qwen Code и сколько угодно через веб-чат:)
То, что Гугл сейчас даёт 500 запросов в день на Gemini 3.1 Flash Lite это не значит, что они потом это не уберут из бесплатного доступа, как это уже не раз случалось с Flash моделями.
"У кого из них есть аналог ai.dev? " - да у всех есть, конечно же.
K0Jlya9
Гугл дает бесплатно даже апи, очень много. А у китайцев бесплатный чат вечно тупит от перегрузок, особенно у больших моделей типа дипсика.
В ai.dev можно использовать модели с полным контекстом, нахаляву, там аттракцион космической щедрости, никогда не видел ничего подобного у других.
Smartor
"Много дают" на старые модели из серии Gemma, что как бы совсем не Gemini.
K0Jlya9
Gemini 3.1 lite дают 500 запросов в сутки на 1 ключ.
На джемму дают 14000.
sami777
Так тут просто реклама ботхаба - за деньги и к бесплатным доступ продают. Между прочим, раньше бесплатные модели плохо решали задачи с множеством вычислений (все плохо решали), например, для матриц. но тут, смотрю, автор говорит, что все вычислялось без ошибок. Поэтому для следующих тестов предлагаю увеличить размерность матриц, например до 5 и более для того же Крамера, например.