OpenAI выпустила GPT-5.5 с кодовым именем «Spud» — первую с нуля переобученную базовую модель со времён GPT-4.5. Разбираем факты.

Память выросла в 8 раз

GPT-5.4 начинал путаться в фактах после 128 тысяч токенов. Новая версия держит контекст до 1 миллиона — это примерно 1500 страниц плотного текста. На тестах MRCR v2 при объёме 512K–1M токенов GPT-5.5 сохраняет точность 74%, тогда как прошлая версия падала до 36,6%, а Claude Opus 4.6 — до 32,2%.

Для сравнения: у Google Gemini 3.1 Pro заявлено окно в 2 миллиона токенов, но по точности извлечения конкретных фактов из больших документов GPT-5.5 пока выигрывает в тестах первых суток.

Кодинг: цифры из закрытых тестов

В Terminal-Bench 2.0 — тест на работу с командной строкой — GPT-5.5 набрал 82,7%. Claude Opus 4.7 на той же задаче: 69,4%, Gemini 3.1 Pro: 68,5%.

В закрытом тесте Expert-SWE (реальные задачи разработки) базовая модель дала 73,1%. OpenAI назвала это готовностью к Enterprise-разработке.

Математика

В блоке FrontierMath Tier 4 — это задачи олимпийского уровня — версия GPT-5.5 Pro набрала 39,6%. Для сравнения: Claude Opus 4.7 там показал 22,9%, Gemini 3.1 Pro — 16,7%.

Браузер

В тестах на веб-навигацию BrowseComp: базовая GPT-5.5 — 84,4%, Gemini 3.1 Pro — 85,9%, GPT-5.5 Pro — 90,1%.

Агент Codex

Встроенный агент пишет код, запускает его в изолированной среде, находит баги и возвращает готовый результат без участия человека. OpenAI тестировала Codex на собственной инфраструктуре: агент написал скрипт балансировки нагрузки на GPU с нуля, скорость инфраструктуры выросла на 20%.

Как запустить из России без подписки

Официальный доступ из РФ заблокирован: нужны иностранный IP, виртуальный номер и карта другой страны. Благо, разработчики SpeShu.AI одними из первых выпустили модель на русском языке. Она доступна без VPN и подписки OpenAI за 20$. 

Сэкономьте время и нервы и начните пользоваться флагманской моделью ChatGPT-5.5 уже сейчас на СПЕШУ АИ.

Комментарии (0)