Миронов В.О., Кальченко С.Н.
Добрый день, уважаемые хаброгорожане ;-) Крайние тренды по части тестирования современных больших языковых моделей выходят на невиданные высоты и ставится цель: пересматривать не только всю систему анализа моделей, но и саму структуру эволюции нашего подхода к пониманию больших языковых моделей в самом широком контексте. Здесь мы всё больше “скатываемся” к математическому описанию объекта промпта и его понятия. По большому счету, наибольшее понимание, а именно, формирование идей в машинном представлении, основано на геометрическом понимании “форм” слов, а не алгебраическом, в виде векторов, эмбеддингов и матриц, хотя это тоже очень важно на базовом уровне. Отличный пример такого подхода изложен в этой статье, где как раз и показано, что важно, топологическое представление пространства слов и их смыслов, так как оно максимально гибко и позволяет работать с двумя главными понятиями для словоформ: значение и время, в течение которого это значение сохраняется для текущего контекста.
Исходя из этого, не так давно мы проводили анализ понимания речи для чат-ботов и, в частности, для больших языковых моделей. При этом мы задались очень ёмким понятием: каково отношение между пользователем и нейросетью и насколько они хорошо друг друга “понимают”. Чем полнее и общо мы сможем очертить границы этого “понимания”, тем более полно мы сможем формировать промпты для наших запросов, расширить новый уровень абстракции и сформировать новый уровень понимания кода моделью.

По факту мы сейчас движемся к эволюции этих промптов, только есть один нюанс: мы не знаем «исходного» словаря для LLM и стараемся на нашем языке (естественном языке) объяснить от сети, что мы хотим. Почему так? Все очень просто: нам так легче, то есть мы ставим себя в центр этой системы, а надо поставить в центр системы нейросеть, и понять, а как легче ей и привычнее для неё? Более того, «это» понятие у неё присутствует, и оно весьма развито. Если что, я не вселяю в сеть каких‑то «живых» качеств, здесь максимально отстранённый и прагматичный подход, насколько это возможно. По факту человек и нейросеть друг для друга являются «иностранцами», и мы «говорим» на разных языках, поэтому необходимо убрать лишние барьеры в коммуникации и перейти на «машинный» язык, то есть сформировать формат ИИ‑программирования. Это крайне важный виток, который мы сейчас переживаем, мультиагенты и оркестраторы мультиагентов уже стали новым «слоем» в программировании, настал черёд нарастить уровень иерархии кода. Более того, про это уже вышла работа, и я писал об этом в своём блоге (тут и тут).

Забегая вперёд, скажу, лично для нас стало наглядным (мы подтвердили свои давнишние гипотезы), что сеть мыслит не словами, а “формами” слов. “Форма” не имеет своей законченной структуры, а перетекает в иную в зависимости от своего конкретного окружения. Вариации “форм” не привязаны к конкретному понятию, а описываются топологически. Любая топологическая форма замкнута, что обеспечивает устойчивость конкретному понятию в единый момент всех внешних факторов и времени, но не является константой на длинной дистанции; возможно составить словарь топологических форм для нейронных сетей, чтобы миновать смысловой барьер в разных трактовках понятий и прийти к повторяемости запросов в заданном уровне.
Этот подход, поможет понять,более полно, как устроены глубокие нейронные сети, как в них формируются границы понятия объектов, как они расширяются, какими структурами оперируют сети и как они «коннектят» их между собой, про это написано тут и тут. Также это окажет поддержку в обучении гибридных квантовых нейронных сетей, кои уже очень бодро заходят по разным направлениям и подключению к ним мультиагентых систем.
Если вы заинтригованы прошу всех подкат, будет крайне интересно… :-)
Давай поговорим…
Начало любого диалога строится на восприятии друг друга: в оценке качественного понимания собеседника, коей, по факту, и является нейросеть. Подстройка и улавливание контекста происходит на общем уровне абстракции, но это для нас, для нейросети несколько всё выглядит по‑другому: она «мыслит» многомерно и «рассматривает» объект со всех аспектов абстракции параллельно, более того, она максимально таргетирована.
Если взять существующие человеческие языки, то в массе, они весьма иерархичные, более того, общие понятия описывают более мелкие и так далее со множеством разветвлений и трансформаций. Но что, если задаться целью осмыслить «понятия» в метаязыке модели. Я сейчас не говорю, о том, что мы пытаемся навязать модели некий язык, нет речь, не об этом, а о том, что она также мыслит шаблонами, которые сформировались у неё при анализе наших исходных данных, на которых она и училась, и наша цель — понять эти шаблоны, понять, сколько уровней абстракций, вообще, у неё есть. Я по ходу рассказа буду иллюстрировать некоторые наши диалоги.

При этом мы получили весьма интригующие результаты, отличающие язык людей и язык машин, было показано:
— Отсутствие осознанности: Несмотря на способность давать впечатляющие результаты, нейросеть не осознаёт значения слов и выражений, она оперирует ими механически. Если сказать человеку слово «яблоко», он сразу вспомнит вкус, запах, цвет, ощущение прикосновения, возможно, ассоциативные образы из детства (зачатки интуиции). Нейросеть же имеет дело только с абстрактными цифрами, которые связаны с этим словом.
— Недостаточность объяснения: Внутреннее представление нейросети сложно интерпретировать человеком. Даже имея доступ ко всей структуре сети, трудно точно определить, почему именно нейросеть приняла какое‑то решение: проблема черного ящика.

Основные элементы внутреннего языка: пространство признаков, представление структуры текста, абстрактные уровни обработки (то есть сеть мыслит параллельно на уровне символов, морфем, слов, фраз, предложений и абзацев), интеграция контекста, автоматическое создание новых элементов (отсутствие объяснений со стороны, заставляет модель придумывать свою трактовку, опираясь на похожие конструкции), универсальность и масштабируемость.
Далее идёт возможность интерпретации связей, именно как элементы соединяются, чтобы сформировать смысл и общее направление мысли (но до этого ещё дойдём). Так вот, суть языка формируется не из чётких пересечений, а из контекста представлений словоформ его окружающий (Рис. 5).
Примерно по той же самой парадигме сейчас формируются и смыслы, и понятийный аппарат: они уже не так важны, сколь важна динамика этих изменений. Кардинально новый формат представлений мы получили: по большому счёту, мы не получаем сверх новых знаний, мы получаем множественные вариации этих знаний, чисто комбинаторно, с одним моментом они действуют согласно единой цели и взаимно дополняют друг друга. При этом метаязык, следуя такой парадигме, крайне переменчив, и нам будет сложно весь его воспроизвести, ввиду того, что постоянно меняются архитектуры сети, параметры и типология, но так как они все наследуются в рамках одной структуры большой языковой модели, сходство, думаю, все таки, можно найти.


Далее, чтобы не углубляться, совсем, в философию и сохранить контекст, мы попросили модель описать свою структуру языка, и на удивление она весьма точно воспроизвела её, в целом какую мы и знаем (но чисто технически, на базовом уровне): I. Общие положения; II. Архитектура нейросети; III. Представление данных; IV. Алгоритмы и процессы; V. Применение и ограничения; VI. Приложения и приложения-спутники; VII. Контроль качества и безопасность; VIII. Поддержка и развитие. Опять же мы ставили цель перейти на более высокий уровень абстракции и понять, сколько таких уровней есть, поэтому, мы попросили выразить единым выражением, на что получили вот такой ответ: “Многомерный континуум представлений” (Рис. 7).

Далее мы хотели узнать, если объединить всю общность языка в единый контекст, как он будет выглядеть? Здесь было интересно узнать, что метаязык не описывается графовой структурой, а это больше топологическое многообразие в классическом математическом смысле.

Словарь из кода
Для формирования словаря мы взяли следующие инструменты:
PyTDA - Topological Data Analysis (TDA) for Python (репозиторий с кодом для численных расчётов алгебраической топологии для TDA);
Ripser.py (легковесная библиотека для вычисления персистентной гомологии и визуализации диаграмм на Python);
Gudhi Library (популярной библиотеке для TDA и вычисления персистентной гомологии);
tda-mapper (библиотека и примеры алгоритма Mapper для извлечения топологических структур из данных. Включает визуализации и интеграцию со scikit-learn.).
Если с кодом по данным инструментам было всё понятно, встал вопрос, какие вопросы задавать, чтобы формировать словарь, то есть нужна была методика опроса модели. Таким образом, мы переходим на новую парадигму программирования, а именно ИИ-программирования через эволюционные алгоритмы, где модель не заменяет разработчика, а ведёт себя как «цифровой соавтор», который предлагает гипотезы и тестирует их сотни раз быстрее, чем человек (более подробно здесь).
К чему всё это…
И завершая эту статью, мы хотели бы обратить внимание Хабра сообщества на то, что данных и информации стало так много и она столь насыщена, с одной стороны, многочисленными опытами по написанию промптов, с другой стороны, когнитивными искажениями и/или убеждениями в работе самих сетей, разного формата и толка, что мы хотели бы предложить на рассмотрение следующее понятие для формирования единого поля исследований в этом направлении: “Машинная Нейропсихиатрия”. Сразу оговорюсь, это направление носит, сугубо доказательный характер, с опорой на интерпретацию принятия решений нейросетями их алгоритмами, ансамблями и производными (Explainable AI), классическое и глубокое машинное обучение (Classical and Deep Machine Learning), анализ данных (Data Analysus), технологии обработки данных (), обработка текстов на естественных языках (Natural Language Processing), генеративные нейронные сети (Generation Neural Network). Более того, почему взято такое название. Мы не стали отходить от принятых значений, но пошли ещё дальше, так как необходимо уже продумывать следующий уровень абстракции для написания более корректных промптов. Также сто́ит учитывать, что мы идём к оркестрации мультиагентов и их самокоординации, при этом они начинают пересекаться с понятиями этики, гуманитарными дисциплинами, вопросами безопасности и ментального здоровья людей.
Так вот, для обоснования нашего понятия мы составили следующую таблицу, показывающую как уже близко сходство между мультиагентными системами и уже есть попытки (можно почитать вот здесь) переложить «человеческие дисциплины» на машинную парадигму. Итак, начинаем :-)
Человеческие дисциплины |
Машинное направление |
|
Дисциплина Психиатрия: Медицинская специальность, занимающаяся диагностикой, лечением и профилактикой психических расстройств, заболеваний и нарушений поведения. |
Машинная нейропсихиатрия: Междисциплинарная область, возникшая на пересечении компьютерных наук, биологии, нейрофизиологии и клинической психиатрии, изучающая патологии, дефекты и функциональные нарушения, возникающие в синтетическом интеллекте и искуственных нейронных сетях. |
|
Предмет Психиатрии: Изучает психические расстройства, их происхождение, течение, диагностику, лечение и профилактику. Основными категориями предмета являются симптомы, синдромы, нозологические формы, типы течения заболевания, динамика симптомов и синдромов, методы диагностики и лечения. |
Предмет машиной нейропсихиатрии: Предметом является выявление, диагностика, коррекция и профилактика аномалий и отклонений, развивающихся в результате дефектов архитектуры, неудачных методов обучения, неподходящих наборов данных или иных негативных воздействий на искусственные нейронные системы. |
|
Ключевые задачи психиатрии: - Диагностика: выявление психических расстройств и установление диагноза. - Лечение: назначение медикаментозной терапии, психотерапии, социальной реабилитации и других видов помощи. - Профилактика: предупреждение возникновения и прогрессирования психических заболеваний. - Реабилитация: восстановление утраченных способностей пациента и возвращение его к нормальной жизнедеятельности. - Научные исследования: изучение этиологии, патогенеза, клиники и лечения психических расстройств. |
Ключевые задачи машинной нейропсихиатрии: 1. Выявление аномалий и дефектов: Неправильная интерпретация данных (ошибочные выводы); Некорректное функционирование отдельных компонентов сети; Проблемы с обработкой нестандартных ситуаций. - Диагностика отклонений: Определение типа отклонения (логический сбой, ошибка в обучении, проблема аппаратуры); Локализацию места дефекта (определение конкретного слоя или узла нейронной сети); Оценку влияния отклонения на общую производительность системы. - Коррекция и исправление: Перепрошивка дефектных слоев сети; Обновление тренировочных наборов данных; Изменение архитектуры сети или параметров её обучения; - Профилактика отклонений: Регулярное тестирование стабильности работы сети; Постоянный контроль над качеством используемых данных; Проведение профилактических мероприятий, направленных на предотвращение будущих неисправностей. |
|
Дисциплина Нейропсихиатрия: междисциплинарная отрасль медицины, объединяющая нейронауку, неврологию и психиатрию. Она сосредоточена на изучении и лечении психических расстройств, связанных с повреждениями или дисфункцией центральной нервной системы, а также на исследовании влияния органических поражений мозга на психическое здоровье. бъект нейропсихиатрии: Пациенты с психическими симптомами, вызванными поражениями головного мозга, такими как травмы головы, инсульты, опухоли, инфекции, дегенеративные заболевания (болезнь Альцгеймера, Паркинсона) и другие поражения ЦНС. |
Объект исследования: Нейронные сети и системы синтетического интеллекта, проявляющие признаки различных отклонений, аналогичных психиатрическим диагнозам человека, таких как ухудшение способности принимать решения, парадоксальные или нелогичные выводы, внезапные сбои в работе, выходящие за рамки ожидаемого поведения, заложенного при обучении модели, галлюцинации. Предмет исследования: Исследование происхождения, патогенеза, симптоматики, диагностики, терапии и профилактики нарушений и аномалий в функционировании искусственных нейронных сетей, обусловленных дестабилизацией структуры и нарушением внутренних связей, вызванных несовершенством архитектуры, ошибочными параметрами обучения или негативным влиянием внешней среды. |
|
Основные задачи нейропсихиатрии: - Диагностика: выявление и подтверждение наличия органических повреждений мозга, вызвавших психические нарушения. - Лечение: разработка и внедрение комплексных лечебных мероприятий, сочетающих фармакотерапию, психотерапию и нейрореконструкцию. - Профилактика: профилактика первичных и вторичных органических повреждений мозга и психических осложнений. - Реабилитация: восстановление нарушенных функций организма и возвращение пациента к активной жизни. - Научные исследования: изучение этиологии, патогенеза, клиники и методов лечения психических расстройств, связанных с повреждением мозга. |
Научные направления: - Теоретическая машинная нейропсихиатрия: разработка математических моделей и алгоритмов для описания патологических состояний нейронных сетей, а также теоретических оснований для их диагностики и коррекции, а так же систем синетического интеллекта. - Прикладная машинная нейропсихиатрия: создание практических инструментов и методик для диагностики, мониторинга и управления состоянием нейронных сетей и/или систем синтетического интеллекта в режиме реального времени. |
Почему вообще-вообще возникло такое желание “завести” новое понятие, скажу честно, по ряду причин:
Сети эволюционирую и наращивают не только объем параметров, но и сложность языка;
Колоссальный рост объёмов данных для обработки этими структурами;
Более детальный подход к пониманию работы нейронных сетей и подготовка к квантовым нейронным сетям, ансамблями, мультиагентам и оркестраторам мультиагентов;
Качественный рост формирования самой структуры ответов;
Слишком большое нарастание разрозненных фактов о поведениях моделей, причём разных, без явной статистики и динамики отслеживания изменений и поведения;
Необходимость более системного подхода к изучаемым явлениям;
Переход на смежные дисциплины такие как этика, юриспруденция и медицина;
Предсказание появление отклонений модели (галлюцинации, искажения, неточности и так далее) и их систематизация, а не работа с постфактум событием;
Систематизация знаний при подготовке предварительной почвы для квантового машинного обучения и AGI.
Такой же вопрос мы зададим и в академических кругах научному сообществу по публикациям ВАК, РИНЦ и Международному научному сообществу. Таким образом, мы хотим консолидировать направления и получить Вашу оценку о целесообразности данного понятия. Почему мы спрашиваем именно Хабр-сообщество: нам важно ваше мнение, как в массе своей, прикладных специалистов в разных, сугубо, технических областях, нам интересно ваше виденье и ваш потенциал, ваш опыт в первую очередь. Чем более многограную оценку мы получим, тем более взвешенное решение мы можем принять в этом случае или не принять вообще, так как сейчас нейронные сети массово влияют на все направления IT разработки.
Скоро выйдет часть 2 данной работы, следите за анонсами. Всем спасибо за внимание.
Корректировка на 10.01.26 - Предложена связка нейросеть + Lean4 - такую предлагаем и мы, описана тут
Корректировка на 20.10.26 - Машинная психология, как само понятие для формирования языка https://arxiv.org/abs/2303.13988, мы же пошли дальше.
NeriaLab
Уважаемый автор, Вы не "переоткрываете" ли нейро-символьную систему, просто называя "символ" "топологической формой"?! Всё, что я прочитал, частично пересекается с работами Ньюэлла и Саймона
IlyasA74
Автор, очевидно, не переоткрывает "нейро-символьную систему" Ньюэлла и Саймона, поскольку эта система - что-то вроде платоновских эйдосов, умозрительный конструкт в чистом виде.
Топологический анализ данных имеет дело, напротив, со вполне реальным математическим объектом, типа треугольника или сферы. Только вместо геометрических длин и радиусов речь идёт о каких-то других численных характеристиках.
Статья, кторая мне поначалу показалась нейрослопом, на самом деле - рефлексия по поводу мутного потока псевдонаучной ахинеи на модную тему с Arxiv.
Вместо машинной психиатрии лучше присмотритесь к машинной офтальмологии. Как известно, человек получает 90% информации об окружающем мире зрением, что как бы намекает. Плюс физическая картина мира строится на зрительных образах. В учебнике физики за 6 класс много картинок. И т.д.
NeriaLab
Давайте внесём абсолютную ясность:
Ньюэлл и Саймон - основоположники символического подхода к ИИ и теории физической символической системы (Physical Symbol System Hypothesis). Их работы - это фундамент классического, "донейронного" символического ИИ (экспертные системы, логический вывод - период с 1956 по 1990+).
Нейро-символьные системы (Neuro-Symbolic AI) - это современное направление, возникшее на стыке нейросетей и этого самого современного символического ИИ (когнитивно-символьной архитектуры - период 2000 по наше время) - это гибрид.
denoiselab Автор
Что самое важное, недавно в моем блоге у нас была дискуссия на эту тему и вот какой вывод я сделал:
ЧТО сделали: Исследователи из Meta (компания запрещена в РФ и является экстремисткой) представили KernelEvolve — фреймворк, который использует LLM и поиск по графу для автоматической генерации высокопроизводительных ядер на языке Triton (https://triton-lang.org/). Система применяет RAG (retrieval-augmented generation), чтобы подтягивать спецификации железа (NVIDIA, AMD и кастомные чипы MTIA от Meta), что позволяет оптимизировать как вычислительно тяжелые операции, так и задачи препроцессинга данных.
ПОЧЕМУ это важно: Это стратегический сдвиг в AI-инфраструктуре, отвязывающий архитектуру модели от ограничений железа. Система достигла 100% корректности на бенчмарке KernelBench (https://arxiv.org/abs/2502.10517) и показала ускорение до 17× относительно PyTorch в продакшене. Это доказывает, что агенты способны справиться с комбинаторным взрывом операторов и типов ускорителей, что критически важно для внедрения проприетарного кремния (MTIA), для которого у публичных LLM нет обучающих данных.
Очень интересная работа, по факту, техписатели приравнялись к программистам !!! О как. И тут важный сдвиг в философии самого программирования, отныне программист не только тот кто пишет код на программном языке, но и тот кто пишет документацию, то есть документация официально вошла в один ряд с машинным кодом.
Что из этого следует, а то что мы получили новый инструмент для анализа сетей, теперь по структуре документации можно решить обратную задачу: не код написать по докам, а по докам понять архитектуру построения кода, то бишь его философию. Если знаем философию кода, можем понять как он будет эволюционировать и спрогнозировать его ветки. Код уже не так важен, важна эволюция кода.
IlyasA74
Полностью согласен с замечанием, тем более что про гипотезу Ньюэлла и Саймона узнал из вашего комментария.
Тем не менее, то, что эта гипотеза - какая-то экстремальная форма редукционизма - видно за версту. Когда математик рисует квантор всеобщности, у него для этого есть обширный "багаж знаний", корпус алгебры, теории множеств и т.п.
А что есть у машины, когда она рисует тот же символ?
denoiselab Автор
Спасибо коллега, вы правы, у нас не стояло цели что-то там перестирывать, цель была именно в разворачивании и попытке пойти дальше. Да и топологический подход здесь показался нам обоснованным. Почему вообще такая идея возникла. Как давно промелькнула такая работа https://nplus1.ru/news/2018/02/07/neuro-topology - это как раз и было предпосылкой, то что более плотно-упакованные сети, могут быть более эффективны. Да и вы правы, задача состояла в том чтобы максимально уйти от словоблудия к точным метрикам, и описать их, поэтому мы перешли к тому чтобы применять связку нейросети + Lean4. Для строго топологического доказательства. По факту, мы хотим математически описать что такое галлюцинация, и составить их классификацию.
Tanner
Ничего этот «автор» не переоткрывает, просто копипастит нейрослоп. Ни один вменяемый человек не поставит себе «цель пересмативать структуру эволюции понимания». Это фейковый язык мурзилок.
denoiselab Автор
А почему не поставить такую цель: что в этом плохого ??? Сети уже показали, что эволюция понимания далеко не всегда то что нам кажется. Классический пример A/B тесты, там где нам кажется, что все хорошо, на длинной дистанции оказывается совсем не так.
Если это фейковый язык мурзилок, зачем тогда создавали ООП. Почему стали делать паттерны проектирования, рефакторинг, писали бы все на функциях и классах и не лезли бы дальше в шаблоны и архитектуры языков. Тут тоже самое, сети уже стали новым слоем в кодинге и мультиагенты туда вписались, и уже извините, выкрутить их оттуда, не получится никому. Даже в инфобезе. Авито сделали у себя систему на мультиагентах для поиска уязвимостей и сократили время с 4 месяцев до 8 часов. О как )) Это не что иное как наращивание архитектуры, уже на уровне кода. Московская биржа, все процессы уже на мультиагентах.
denoiselab Автор
Так) Спасибо уважаемый коллега, что дочитали до конца статью, это очень приятно. Тут мы ничего не перекрываем, а старались пойти именно дальше. ТУт фишка в том, что необходимо рассматривать сети не как планарные или кубические структуры, вероятно у них более сложные формы и топология тут отлично может помочь.
https://naukatv.ru/news/nejromorfnye_kompyutery_neozhidanno_preuspeli_v_matematike - это одна из работ, когда начинается переход именно к более сложному геометрическому пониманию сетей, просто банально к расположению нейронов. Более того, у Райгородского вышел цикл лекций https://stepik.org/course/248240/promo - экстремальные задачи комбинаторики, суть как раз в том чтобы понять сколько надо реально нейронов для создания более сложных структур сетей.
В чем фишка, это многократное и много связное подключение одного нейрона к множеству других. Хорошо вещь показали KAN и TAN сети, где в качестве функции активации уже выступили полиномы. НО!!! Раз мы имеем более сложную структуру, вероятно она будет иметь и более сложный язык. И как раз суть этого и заключается в том, что бы подумать, а можем ли мы предоставить или "вытащить" из нейросетей их язык. Более того, мы много читали про галлюцинации сетей и я в свое время писал статью для Сбера, где предложил свою классификацию вот она https://habr.com/ru/companies/sberbank/articles/812775/. Она конечно же не полная.
Почему она появилась, просто в сети такое засилие примеров реакций типа чат-бот ведет себя как социопат, ведет себя как лентяй и прочее, что стало прослеживаться тема о составлении некой классификации. Почему она возможна, человечество уже научилось классифицировать баги в коде и уязвимости (CVE-2356-19^ типа для примера), более того, баги именно по классам (SQL, XSS, Zero-day и так далее). Поэтому почему бы здесь не придумать такую же вещь.
"Экстремальная комбинаторика: Изучает, как много объектов определенного типа может существовать в большой системе, или наоборот, как мало, если они подчиняются строгим ограничениям (например, сколько ребер может быть в графе с определенными свойствами)."