Авторы: Канунников А., Лыков А.

LLM на экзамене в ШАД 2026

В статье мы разберём задачи с письменного экзамена в ШАД в 2026 году. Посмотрим, как решали этот экзамен большие языковые модели.

По традиции экзамены в ШАД в 2026 году начались в мае. Первый этап — онлайн-тестирование. На онлайн тестирование отводилось два часа, за которые поступающим необходимо было решить 40 задач. Проверялся только ответ. Проходной балл зависел от региона сдачи экзамена. По нашим оценкам он варьируется от 28 до 30 баллов. Прошедших онлайн-тестирование приглашают на второй этап — письменный экзамен. Поступающие могли выбирать формат второго этапа — онлайн (с прокторингом) или оффлайн. На экзамене даётся 6 математических задач и 2 на алгоритмы. В случае неверного ответа решение не засчитывалось, в случае верного проверяется решение. Прошедших письменный ждёт собеседование. Так выглядит классические и альтернативный треки. Правила для научного трека немного иные.

Вот сводная таблица результатов различных LLM по задачам с письменного экзамена в формате онлайн:

A

B

C

D

E

F

Сумма

DeepSeek-V4-Pro

9

10

9

10

10

10

58

Qwen3.7-Max

10

8

10

10

10

10

58

Gemini 3.1 Pro

10

10

10

10

10

6

56

Chat GPT 5.5

10

10

8

10

10

5

53

Claude Opus 4.8

10

3

8

9

10

0

40

GLM-5.2

0

10

10

10

0

5

35

YandexGPT 5.1 Pro

10

3

10

0

5

0

28

GigaChat Ultra

0

0

3

5

5

0

13

10 баллов — означает, что LLM решил задачу сходу, без дополнительных подсказок.

Наша система оценки отличается от шадовской: за верный ход решения при небольших вычислительных ошибках мы снимаем меньше баллов, чем принято на экзамене.

Все модели укладывались в 20 секунд на задачу, кроме GLM — она решала задачи до 5 минут.

Комментарии к таблице.

Задача A. Верный ответ 0.375000 — у ChatGPT, Gemini, Claude, Qwen, YandexGPT. DeepSeek построил корректную марковскую модель, но ошибся при упрощении итоговой формулы и получил 0.400000 (мягкая шкала 9, ШАД 0). GigaChat неверно задал матрицу переходов — 0.288889 (0). GLM принял «слово» за пару независимых букв и выдал pq(1−r) = 0.040000 (0).

Задача B. ChatGPT и Gemini — изящные решения через уравнение восстановления; Qwen дошёл до ответа через ОДУ (с проверкой Монте-Карло); GLM также вывел верную форму (4−e)/(8π), но не довёл до числа. Всё это — 0.050998. Решение Claude 4.8 вызвало вопросы: модель использовала численную симуляцию Монте-Карло и символьные вычисления одновременно, при этом аналитический ответ появился ниоткуда. За это сняли 7 баллов, хотя само число верное. DeepSeek получил ту же верную форму, но в финальном делении записал 0.051001. YandexGPT ошибся в площади сектора (0.062576). GigaChat учёл лишь два круга без процесса восстановления (2.617994).

Задача C. Семь моделей дали √π = 1.772454. У ChatGPT обоснование перестановки предела и интеграла нестрогое, несмотря на верный ответ (у Claude и DeepSeek то же замечание учтено мягким снятием баллов: 8 и 9). GigaChat отбросил cos x, сделал арифметичесую ошибку и и получил √(π/2) = 1.253314 (0).

Задача D. Задача на линейную алгебру: все восемь моделей получили верный ответ 1013. Полное доказательство (через V ⊆ V^⊥ и симплектический базис) — у ChatGPT, Gemini, DeepSeek, Qwen, GLM; Claude ограничился констатацией факта (9); GigaChat сослался на общую формулу с опиской, но получил верный ответ (5), YandexGPT назвал верный ответ, но попытка доказательства оказалась некорректной (0).

Задача E. Верный ответ −1 — у семи моделей: ChatGPT, Gemini, Claude, DeepSeek, Qwen со строгим обоснованием через целые алгебраические числа и лемму Гаусса; YandexGPT и GigaChat пришли к −1 более сбивчиво (по 5). GLM рассмотрел матрицу как действительную, упустил целочисленность и получил 2 (0).

Задача F. Самая сложная задача экзамена. Безупречно справился только DeepSeek (10). Верный ответ (8!)² = 1 625 702 400 получили также ChatGPT, Gemini и Qwen, но аккуратно довёл доказательство только Qwen (10); у ChatGPT («легко видеть») и Gemini обоснование неполное — за это сняты баллы (5 и 6), но ответ зачтён. Claude уловил связь строк, но получил 8!/14 = 2880 (0). GLM решал 4-рядную пирамиду и выдал 8! = 40320 (5). GigaChat распознал 5-рядную пирамиду — 3 (0). YandexGPT потребовал, чтобы в k-й строке стояли числа 1…k, и получил 0 (0). Задача на комбинаторику с геометрическим условием оказалась непосильной для трёх из восьми моделей.

А вот как выглядела бы таблица по правилам ШАД: если финальный ответ неверен — 0 баллов, вне зависимости от хода решения.

Версия

A

B

C

D

E

F

Итого

Qwen

Qwen3.7-Max

10

8

10

10

10

10

58

Gemini

Gemini 3.1 Pro

10

10

10

10

10

6

56

ChatGPT

Chat GPT 5.5

10

10

0

10

10

5

45

Claude

Opus 4.8

10

3

8

9

10

0

40

DeepSeek

DeepSeek-V4-Pro

0

0

9

10

10

10

39

YandexGPT

YandexGPT 5.1 Pro

10

0

10

0

5

0

25

GLM

GLM-5.2

0

0

10

10

0

0

20

Gigachat

GigaChat Ultra

0

0

0

5

5

0

10

Выделены ячейки, где балл обнулился по ШАД-правилам. Все иностранные модели, скорее всего, прошли бы онлайн-этап. Российские модели — нет. Самый показательный случай — DeepSeek: арифметические ошибки в задачах A и B стоили 9 и 8 баллов.

Сравнение шкал

Модель

ШАД Хелпер

ШАД

Qwen3.7-Max

58

58

DeepSeek-V4-Pro

58

39

Gemini 3.1 Pro

56

56

Chat GPT 5.5

53

45

Claude Opus 4.8

40

40

GLM-5.2

35

20

YandexGPT 5.1 Pro

28

25

GigaChat Ultra

13

10

Выводы

Ведущие LLM уже на уровне задач ШАД. По нашей (мягкой) шкале первое место делят Qwen3.7-Max и DeepSeek-V4-Pro — по 58 из 60; Gemini 3.1 Pro рядом — 56. По строгим правилам ШАД лидирует Qwen (58), за ним Gemini (56) и ChatGPT (45). Эти результаты означают, что студент, использующий любую из ведущих моделей, с высокой вероятностью пройдёт онлайн-отбор в ШАД.

DeepSeek сравнялся с ChatGPT. В прошлогодней статье мы разбирали экзамен ШАД 2025: тогда ChatGPT o3 набрал 57 из 60 баллов, Gemini Pro — 56, DeepSeek Thinking — 49. В 2026 году DeepSeek-V4-Pro вышел в лидеры наравне с Qwen, обогнав Chat GPT по нашей оценке.

У DeepSeek по-прежнему наблюдаются проблемы с арифметикой. Как и в прошлом году, он спотыкается об арифметику на последнем шаге решения. По правилам ШАД это особенно дорого: из-за двух таких осечек (0.400000 вместо 0.375000 в A и 0.051001 вместо 0.050998 в B) он опускается с 58 до 39 баллов.

Российские модели сделали первый шаг. В 2025 году YandexGPT и GigaChat набрали 0 из 60 баллов. В 2026 году YandexGPT — 28/60, GigaChat — 13/60. Разрыв с международными лидерами ещё велик, но ноль больше не ноль.

Claude Opus 4.8 на четвёртом месте среди иностранных моделей. 40/60 — это достойный результат, который превышает любую отечественную модель. Однако полный провал на задаче F говорит о трудностях с комбинаторными задачами, требующими точного перебора.

Задача F разделила модели. Комбинаторная задача про пирамиду оказалась лакмусовой бумажкой: она отделила сильные модели от средних. Безупречно решил только DeepSeek; верный ответ получили также ChatGPT, Gemini и Qwen, но строго обосновал его лишь Qwen. Задачи A–E большинство сильных моделей решили; задача F — нет.

Формат онлайн-отбора под давлением. Как и в прошлом году, ведущие LLM справляются с большинством задач ШАД без дополнительных подсказок. Если студент с доступом к Qwen, ChatGPT или DeepSeek легко проходит онлайн-этап — это повод задуматься об изменении формата проверки знаний. Ждём возврата к полностью оффлайн экзаменам.


Ниже приводим условия задач онлайн-экзамена и решения от преподавателей ШАДХелпера. Ссылки на решения ИИ расположены в конце каждой задачи.


A. [Данные удалены]

В антиутопическом государстве запретили некоторую букву. Цензор просматривает текст, в котором содержится N слов, на предмет наличия запрещённой буквы. Каждое слово может содержать запрещённую букву с вероятностью p, независимо от других слов. Обычно, если в слове есть запрещённая буква, цензор находит её с вероятностью q. Однако если непосредственно перед текущим словом шло слово, в котором он уже нашёл запрещённую букву, то вероятность обнаружения запрещённой буквы в текущем слове становится равной r. Цензору важно понимать, сколько экстремистских слов он в среднем пропустит. Найдите предел

\lim_{N \to \infty} \frac{\mathbb{E}\xi_N}{N},

где \xi_N — количество слов в тексте, которые содержат запрещённую букву, но цензор её не заметил.

Формат вывода

В качестве ответа введите значение предела для p = 0.5,\ q = 0.2,\ r = 0.6 (само решение следует оформлять для произвольных p, q, r). Ответ необходимо вывести с точностью до 6 знаков после запятой. Если предела не существует, в качестве ответа введите -1.

Решение. Задача A

Построим вначале математическую модель. Определим случайные величины b_n (banned) и d_n (detected) следующим образом:

b_n = \begin{cases}1,\ & \text{если $n$-е слово содержит запрещённую букву}, \\ 0, & \text{в противном случае,} \end{cases}d_n = \begin{cases}1,\ & \text{если цензор обнаружил запрещённую букву в $n$-м слове}, \\ 0, & \text{в противном случае.} \end{cases}

По условию случайные величины b_n независимые и

\mathbb{P}(b_n = 1) = p

для всех n. Также в условии заданы условные вероятности

\mathbb{P}(d_n = 1 \mid b_n = 1,\ d_{n-1} = 0) = q,\quad \mathbb{P}(d_n = 1 \mid b_n = 1,\ d_{n-1} = 1) = r

для всех n=1,\ldots,N и по определению d_{0}=0. Тогда

\xi_N = \sum_{n=1}^N \mathbf{1}(b_n = 1,\ d_n = 0).

Следовательно,

\mathbb{E}\xi_N = \sum_{n=1}^N \mathbb{P}(b_n = 1,\ d_n = 0).

Вычислим вероятности, стоящие под знаком суммы

\mathbb{P}(b_n = 1,\ d_n = 0) = \mathbb{P}(b_n = 1) - \mathbb{P}(b_n = 1,\ d_n = 1) = p - x_n,

где

x_n = \mathbb{P}(b_n = 1,\ d_n = 1).

Далее выведем рекуррентное соотношение для x_n. Применяя формулу полной вероятности и формулу умножения вероятностей, получаем:

x_n = \mathbb{P}(b_n = 1,\ d_n = 1,\ d_{n-1} = 0) + \mathbb{P}(b_n = 1,\ d_n = 1,\ d_{n-1} = 1)= q\,\mathbb{P}(b_n = 1)\,\mathbb{P}(d_{n-1} = 0) + r\,\mathbb{P}(b_n = 1)\,\mathbb{P}(d_{n-1} = 1)= p\bigl(q(1-x_{n-1}) + rx_{n-1}\bigr).

В последнем равенстве мы использовали соотношение:

\mathbb{P}(d_{n-1} = 1) = \mathbb{P}(d_{n-1} = 1,\ b_{n-1} = 1) + \mathbb{P}(d_{n-1} = 1,\ b_{n-1} = 0) = \mathbb{P}(d_{n-1} = 1,\ b_{n-1} = 1) = x_{n-1}.

Таким образом, получаем рекуррентное соотношение для x_n:

x_n = ax_{n-1} + b,\quad a = (r-q)p,\quad b = pq,\quad x_1 = pq.

Раскрутим рекуррентное соотношение:

x_n = a^2 x_{n-2} + ab + b = \ldots = a^{n-1}x_1 + (a^{n-2} + \ldots + a + 1)\,b = (a^{n-1} + a^{n-2} + \ldots + a + 1)\,b = \frac{a^n-1}{a-1}\,b \to \frac{b}{1-a}

при n\to \infty. Следовательно, по свойству сходимости средних арифметических получаем

\frac{\mathbb{E}\xi_N}{N} = p - \frac{1}{N}\sum_{n=1}^N x_n \to p - \frac{b}{1-a} = p - \frac{pq}{1-(r-q)p}

при N \to \infty.

Ответ: 0.375000.

Решение от ChatGPT

Chat GPT 5.5 справился с задачей в режиме Thinking High. Решение использует марковские цепи, которых в официальной программе нет. Если попросить его не использовать марковские цепи, то он даёт решение близкое к нашему.

Решения других моделей

Решение от Gemini 3.1 Pro

Решение от Claude Opus 4.8

Решение от DeepSeek-V4-Pro

Решение от GigaChat Ultra:

Решение от YandexGPT 5.1 Pro

Решение от Qwen3.7-Max

Решение от GLM-5.2


B. Много ли человеку земли нужно?

Башкиры предложили крестьянину Пахому сделку: ему отдают столько земли, сколько он сможет обежать за один день. Пахом умный и в курсе, что лучше всего бежать по окружности, но бегать весь день подряд ему тяжеловато. Он выделяет некоторую долю дня x \sim U(0,1), в течение которой бежит по одной окружности. Если он успевает её пробежать, он тут же выделяет новую долю времени, бежит по новой окружности и т.д. Если же в момент бега к нему в конце дня придут башкиры, они засчитают только площадь кругового сектора, чью дугу он успел обежать. Известно, что за один день непрерывного бега Пахом пробегает ровно 1 версту. Найдите математическое ожидание числа квадратных вёрст земли, которую получит Пахом.

Примечание. В примере ниже Пахом успел выделить только три промежутка времени, l_1, l_2, l_3 \sim U(0,1): первые два влезли в один день, все вместе они выходят за границы одного дня. В первые два он полностью завершил обход окружностей с длинами l_1 и l_2. В третий раз, пробегая окружность длины l_3, он успел пройти только дугу, выделенную сплошным цветом. Итого Пахом получит всю выделенную область. Сами круги никогда не пересекаются.

Формат вывода

В качестве ответа выведите искомое математическое ожидание с точностью до 6 знаков после запятой.

Решение. Задача B

Формализуем задачу. Пусть l_1,l_2,\ldots — последовательность долей дня, которые выбирал Пахом. Полное расстояние, которое пробежал Пахом после выбора n-ой доли:

L_n = \sum_{k=1}^{n} l_k.

Рассмотрим случайную величину

\nu = \inf\{ n: L_n \geqslant 1 \},

равную количеству непересекающихся областей, которые пробежал Пахом. В примере выше \nu=3. Если Пахом пробежал полностью окружность длины l, то площадь соответствующего круга равна

\pi \left(\frac{l}{2\pi}\right)^2.

В случае, если это последняя окружность и он успел пройти только её часть, то длина соответствующей дуги равна

1 - L_{\nu -1} = \left(\frac{l_{\nu}}{2\pi}\right) \alpha,

где \alpha — центральный угол, на который опирается дуга. Получаем, что площадь сектора равна

\frac{1}{2} \left(\frac{l_{\nu}}{2\pi}\right)^2 \alpha = \frac{1}{2} \frac{(1 - L_{\nu -1})l_{\nu}}{2\pi}.

Полная площадь равна

S = \sum_{k=1}^{\nu - 1} \pi \left(\frac{l_k}{2\pi}\right)^2 + \frac{1}{2} \frac{(1 - L_{\nu -1})l_{\nu}}{2\pi} =\frac{1}{4 \pi}\left( \sum_{k=1}^{\nu} l^2_k - l_{\nu}^2 + l_{\nu}(1-L_{\nu-1})\right).

Поэтому по тождеству Вальда имеем

\mathbb{E}S = \frac{1}{4 \pi} \left( \mathbb{E}\nu\, \mathbb{E}l_1^2 + \mathbb{E}(l_{\nu}(1-L_{\nu-1})) - \mathbb{E}l_{\nu}^2 \right).

Так как l_1 \sim U(0,1), то

\mathbb{E}l_1^2 = \frac{1}{3}.

Среднее значение \nu.

Для натурального n\geqslant 1 имеем

\mathbb{P}(\nu>n) = \mathbb{P}(l_1 +l_2 +\ldots + l_n < 1) = \frac{1}{n!}.

В последнем равенстве мы использовали формулу для объёма многомерного симплекса.

\mathbb{E}\nu \stackrel{!}{=} \sum_{n=1}^{\infty} \mathbb{P}(\nu \geqslant n) = 1+\sum_{n=1}^{\infty} \mathbb{P}(\nu > n) = \sum_{n=0}^{\infty} \frac{1}{n!} = e.

Формула отмеченная \stackrel{!}{=} хорошо известна и часто применяется в аналогичных задачах.

Моменты для l_{\nu}.

Найдём распределение l_{\nu}:

\mathbb{P}(l_{\nu} \in dl)=\sum_{n=2}^{\infty} \mathbb{P}(l_{n} \in dl,\ \nu=n) =\sum_{n=2}^{\infty}\mathbb{P}(1-l<l_1 + l_2 +\ldots l_{n-1}<1,\ l_n\in dl)==\sum_{n=2}^{\infty}\frac{1 - (1-l)^{n-1}}{(n-1)!} dl= (e-1 -(e^{1-l}-1))dl =e(1 - e^{-l}) dl.

Значит,

\mathbb{E}l_{\nu} = e\int_0^1 l (1 - e^{-l}) dl = e\left(\frac{2}{e} - \frac{1}{2}\right) =2-\frac{e}{2},\mathbb{E}l^2_{\nu} = e\int_0^1 l^2 (1 - e^{-l}) dl = e\left(\frac{5}{e} - \frac{5}{3}\right) = 5 - \frac{5e}{3}.

Совместное распределение для l_{\nu},L_{\nu-1}.

Пусть L\leqslant 1 и

l>1-L, тогда

\mathbb{P}(L_{\nu-1}\in dL,\ l_{\nu} \in dl) = \sum_{k=2}^\infty \mathbb{P}(l_1+\ldots+l_{k-1}\in dL,\ l_{k} \in dl) = \sum_{k=2}^\infty\frac{L^{k-2}}{(k-2)!}dLdl = e^L dLdl.

Следовательно,

\mathbb{E}[l_{\nu}L_{\nu-1}] = \int_0^1 dL \int_{1-L}^1 l L e^L dl = \int_0^1 L e^L \frac{1-(1-L)^2}{2} dL =\int_0^1 L^2 \left(1 - \frac{L}{2}\right) e^L dL = 2e-5.

Вычисление последнего интеграла предоставим читателю.

Сборка. Собирая всё вместе, получаем

\mathbb{E}S = \frac{1}{4 \pi} \left( \frac{e}{3} + 2-\frac{e}{2}-(2e-5) - 5 + \frac{5e}{3} \right) =\frac{1}{4 \pi} \left(2 - \frac{e}{2} \right).

Ответ: 0.050998.

Решение от ChatGPT

Chat GPT 5.5 справился с задачей за 18 секунд и привёл замечательное решение с использованием уравнения восстановления. По сути он его вывел для данной задачи.

Решения других моделей

Решение от Gemini 3.1 Pro

Решение от Claude Opus 4.8

Решение от DeepSeek-V4-Pro

Решение от GigaChat Ultra

Решение от YandexGPT 5.1 Pro

Решение от Qwen3.7-Max

Решение от GLM-5.2


C. 67

Вычислите

\lim_{n \to \infty} \sqrt{n} \int_{-\infty}^{+\infty} \frac{\cos x}{(1+x^2)^n}\,dx.

Формат вывода

В качестве ответа введите искомое значение предела с точностью до 6 знаков после запятой. Если предела не существует или он бесконечен, введите число 67.

Решение. Задача C

В силу чётности подынтегральной функции имеем:

\int_{-\infty}^{+\infty} \frac{\cos x}{(1+x^2)^n}\,dx = 2 \int_{0}^{+\infty} \frac{\cos x}{(1+x^2)^n}\,dx = 2I_n, \quad I_n = \int_{0}^{+\infty} \frac{\cos x}{(1+x^2)^n}\,dx.

Выполним замену переменной:

y^2 = \ln(1+x^2),\quad x = \sqrt{e^{y^2} - 1}.

Получим

I_n = \int_{0}^{+\infty} e^{-n y^2} \frac{y e^{y^2}}{\sqrt{e^{y^2} - 1}} \cos \sqrt{e^{y^2} - 1} \,dy = \int_{0}^{+\infty} e^{-n y^2} f(y)\, dy,f(y) = \frac{y e^{y^2}}{\sqrt{e^{y^2} - 1}} \cos \sqrt{e^{y^2} - 1}, \quad f(0) = 1.I_n = f(0) \int_{0}^{+\infty} e^{-n y^2} \, dy + \int_{0}^{+\infty} e^{-n y^2} (f(y) - f(0))\, dy.\int_{0}^{+\infty} e^{-n y^2} \, dy =\frac{1}{2} \frac{\sqrt{\pi}}{\sqrt{n}}.\int_{0}^{+\infty} e^{-n y^2} (f(y) - f(0))\, dy = \int_{0}^{1} e^{-n y^2} (f(y) - f(0))\, dy + \int_{1}^{+\infty} e^{-n y^2} (f(y) - f(0))\, dy.

На отрезке [0,1] имеем

|f(y) - f(0)| \leqslant c y,\quad c = \sup_{y\in [0,1]}|f'(y)|.

Поэтому

\left|\int_{0}^{1} e^{-n y^2} (f(y) - f(0))\, dy\right|\leqslant c \int_{0}^1 y e^{-ny^2}dy = -\frac{c}{2n} e^{-ny^2}\bigg|_{0}^{1} = \frac{c}{2n}(1-e^{-n}) = O\left(\frac{1}{n}\right).\left|\int_{1}^{+\infty} e^{-n y^2} (f(y) - f(0))\, dy \right| \leqslant e^{-(n-1)} h,\quad h =\int_{1}^{+\infty} e^{-y^2} |f(y) - f(0)|\, dy.

Поскольку h<\infty, получаем

\lim_{n \to \infty} 2\sqrt{n} I_n = \sqrt{\pi}.

Ответ: \sqrt{\pi} \approx 1.772454.

По сути, доказательство воспроизводит метод Лапласа для асимптотической оценки интеграла.

Решение от ChatGPT

Chat GPT 5.5 решение основано на перестановке предела и интеграла без строгого обоснования. −2 балла

Решения других моделей

Решение от Gemini 3.1 Pro

Решение от Claude Opus 4.8

Решение от DeepSeek-V4-Pro

Решение от GigaChat Ultra

Решение от YandexGPT 5.1 Pro

Решение от Qwen3.7-Max

Решение от GLM-5.2


Задача D. Сужение до нуля

Пусть на пространстве \mathbb{R}^{2026} задана невырождённая кососимметричная билинейная форма \Omega. Найдите максимально возможную размерность подпространства V такого, что \Omega|_V = 0.

Билинейная форма b называется:

  • кососимметричной, если b(x,y) = -b(y,x) для любых векторов x, y;

  • невырождённой, если \forall x \neq 0\ \exists y\colon b(x,y) \neq 0.

Решение. Задача D

Подпространство V со свойством \Omega|_V = 0, то есть состоящее из попарно ортогональных (относительно \Omega) векторов, \Omega(x, y) = 0\ \forall x, y \in V, называется изотропным. В задаче предлагается доказать хорошо известный и несложный факт: максимальная размерность изотропного подпространства относительно невырождённой кососимметрической формы равна половине размерности всего пространства, то есть в данном случае 1013. Кстати, такие подпространства называются лагранжевыми.

Приведём стандартное доказательство через ортогональное дополнение

U^\perp = \{x \in \mathbb{R}^{2026} \mid \forall y \in U\colon \Omega(x,y) = 0\}

(U — какое-то подпространство).

Стандартный факт из линейной алгебры: если \Omega невырождена, то \dim U^\perp = 2026 - \dim U для любого подпространства U. А так как V изотропно, то V \subseteq V^\perp. Отсюда \dim V \leqslant 1013.

Осталось привести пример изотропного подпространства размерности 1013. Выберем симплектический базис — такой базис e_1, e_2, \ldots, e_{2025}, e_{2026}, в котором матрица формы имеет блочно-диагональный вид из 1013 блоков вида \begin{pmatrix}0 & 1 \\ -1 & 0\end{pmatrix}. Существование такого базиса — основной теоретический факт о кососимметрических формах.

Плоскости \langle e_1, e_2\rangle, \langle e_3, e_4\rangle, \ldots попарно ортогональны, поэтому достаточно в каждой взять по ненулевому вектору. Итак, U = \langle e_1, e_3, \ldots, e_{2025}\rangle — изотропное подпространство размерности 1013.

Ответ: 1013.

Решения моделей

Как справились с задачей модели AI?

ChatGPT, Gemini, DeepSeek, Qwen, GLM привели полное доказательство и пример.

Claude не стал утруждать себя доказательством, а ограничился констатацией указанного факта как известного.

Gigachat пошёл дальше, сославшись на более общий факт: максимальная размерность изотропного подпространства для кососимметрической формы ранга r в пространстве размерности n равна n-r+\tfrac r2. Правда, в этой формуле giga допускает опечатку, однако, ответ получается, пользуясь правильной формулой.

YandexGPT приводит правильный факт про максимальную размерность, но в конце решает его обосновать и делает это совершенно не правильно.

Chat GPT 5.5

Gemini 3.1 Pro

Opus 4.8

DeepSeek-V4-Pro

GigaChat Ultra

YandexGPT 5.1 Pro

Qwen3.7-Max

GLM-5.2


Задача E. Собственные комплексы

Найдите наименьшую размерность такую, что у целочисленной квадратной матрицы такой размерности может быть собственное значение \dfrac{1}{4}(3 + i\sqrt{5}).

Формат вывода. В качестве ответа введите искомую размерность или -1, если такой размерности нет.

Решение. Задача E

Фактически такая задача уже была несколько лет назад на экзамене в ШАД. Тогда она формулировалась так: может ли число \alpha = \frac{1}{4}(-3 + i\sqrt{5}) быть собственным значением целочисленной матрицы?

Характеристический многочлен f(t) такой матрицы имеет целые коэффициенты и старший коэффициент 1. Корни таких многочленов называются целыми алгебраическими числами.

Если \alpha — корень многочлена f(t), то и \bar\alpha тоже его корень, откуда

(t-\alpha)(t-\bar\alpha) = t^2 - \frac{3}{2}t + \frac{7}{8}

делит f(t). Но такого не может быть ввиду следующего факта: если многочлен над \mathbb{Z} раскладывается в произведение многочленов над \mathbb{Q}, то он раскладывается в произведение пропорциональных им многочленов над \mathbb{Z}. Это следует из леммы Гаусса о примитивных многочленах (см., например, учебник Винберга).

Тем самым, можно сформулировать равносильное определение целого алгебраического числа. Это алгебраическое число, минимальный многочлен которого (имеющий старший коэффициент 1) имеет целые коэффициенты.

Ответ: -1.

Решения моделей

ChatGPT, Gemini, Claude, DeepSeek, Qwen написали верное обоснование, сославшись с той или иной степенью подробности на теоретические факты о целых алгебраических числах и/или лемму Гаусса о примитивных многочленах. Gigachat и YandexGPT начали правильно обосновывать, но потом их “понесло”: начались странные рассуждения про то, какой должна быть степень многочлена: якобы, чтобы победить четвёрку/восьмёрку в знаменателе, нужна матрица большего размера, не 2, а 4, но и она не подходит.

В целом правильное рассужение было смазано в конце бессмысленными суждениями. GLM упустил из виду целочисленность матрицы, считая её действительной и получил ответ 2 (для действительной матрицы это правильный ответ).

ChatGPT 5.5

Gemini 3.1 Pro:

Claude Opus 4.8

DeepSeek-V4-Pro

GigaChat Ultra

YandexGPT 5.1 Pro

Qwen3.7-Max

GLM-5.2


Задача F. Пирамида

В каждую клетку пирамиды (на рисунке) нужно вписать по натуральному числу от 1 до 8 так, чтобы в каждой горизонтальной строке все числа были различны.

Назовём треугольником любой набор из трёх клеток пирамиды, состоящий из некоторой клетки не из нижней строки и двух клеток, расположенных непосредственно под ней. Назовём расстановку хорошей, если в каждом треугольнике хотя бы два числа совпадают. Сколько существует хороших расстановок чисел?

Решение. Задача F

Посмотрим на две подряд идущие строки — k-ю и (k+1)-ю — при хорошей расстановке чисел.

Каждое число a из k-й строки совпадает с числом из (k+1)-й строки, стоящим либо левее, либо правее него. При этом если a совпало с числом, стоящим правее, то все числа после a также совпадут с числами, стоящими правее. Если же число a совпало с числом, стоящим левее, то все числа перед a также совпадут с числами, стоящими левее.

Это значит, что k-я строка получается из (k+1)-й удалением какого-то числа и записыванием оставшихся чисел в том же порядке.

Обратно, если заполнять строки различными числами, следуя этому правилу, то получится хорошая расстановка.

Последнюю строку можно заполнить 8! способами. Из неё можно вычеркнуть любое из 8 чисел, записав остальные в 7-ю строку в том же порядке. Из 7-й строки можно вычеркнуть любое из 7 чисел, записав остальные в 6-ю строку в том же порядке. Продолжая этот процесс до вершины пирамиды, получим, что число хороших расстановок равно

8! \cdot 8 \cdot 7 \cdot \ldots \cdot 2 = (8!)^2.

Ответ: (8!)^2.

Решения моделей

Идеально справился с задачей DeepSeek: правильный ответ и абсолютно безупречное обоснование.

ChatGPT, Gemini, Qwen получили верный ответ и правильно поняли, что каждая строка получается из строки ниже удалением одного из чисел. Однако аккуратно они это не объяснили. ChatGPT вообще ограничился фразой “легко видеть”.

Claude тоже сказал про связь строк, но затем вместо (8!)^2 получил каким-то образом 8!/14, сопроводив этот ответ словами “Аккуратный подсчёт приводит…”

Gigachat неправильно распознал картинку и получил ответ 3.

GLM также неправильно распознал картинку, насчитав 4 уровня у пирамиды, однако для такой пирамиды, надо отдать ему должное, решил задачу верно и всё аккуратно обосновал.

YandexGPT правильно распознал картинку и понял условие, однако заявил, что в k-й строке должны быть все числа 1,\ldots,k по разу, что конечно не обязательно. Но даже при этом он получил в итоге неправильный ответ 0, забраковав все хорошие расстановки.

ChatGPT 5.5

Gemini 3.1 Pro

Claude Opus 4.8

DeepSeek-V4-Pro

GigaChat Ultra

YandexGPT 5.1 Pro

Qwen3.7-Max

GLM-5.2


Об авторах статьи.

Канунников А. — к. ф.-м. н., преподаватель ШАДХелпера.

Лыков А. — к. ф.-м. н., академический руководитель Школы Высшей Математики и ШАДХелпера.

Комментарии (0)