Комплексное решение на практике: система «Джинн»
Комплексное решение на практике: система «Джинн»

Данная работа подготовлена командой Infolabs и предназначена для специалистов, внедряющих цифровые решения в государственном и муниципальном управлении, IT-экспертов, аналитиков, архитекторов систем, интеграторов, а также исследователей в области искусственного интеллекта и цифровой трансформации. Материал будет полезен как сотрудникам органов власти, так и всем, кто ищет практические примеры внедрения современных технологий для повышения эффективности обратной связи с гражданами.

Логотип
Логотип

Во второй части работы представлен детальный разбор практического опыта создания и внедрения системы «Джинн» — платформы для автоматизации мониторинга, интеллектуальной классификации и маршрутизации обращений граждан. Описаны архитектура решения, ключевые бизнес-процессы, технические особенности, методы интеграции с внешними сервисами, а также механизмы дообучения моделей на реальных данных. Особое внимание уделено реальным результатам эксплуатации и возможностям масштабирования системы для различных регионов и задач государственного управления.

Этот материал может служить методическим пособием для специалистов по цифровизации и цифровым управленцам, а также быть полезным всем, кто занимается развитием современных сервисов обратной связи между государством и обществом.

Часть 1. Цифровое взаимодействие: Социальные сети как инструмент связи между государством и гражданами

Демонстрации системы

Видео (гифки) долго загружается
Видео демонстрации 1
Видео демонстрации 1
Видео демонстрации 2
Видео демонстрации 2

1. Описание системыи его функционал

Одним из наиболее современных решений на российском рынке, охватывающих все ранее описанные задачи цифрового взаимодействия, является система «Джинн» — единая платформа для сбора, автоматизированной обработки и маршрутизации сообщений граждан. «Джинн» может использоваться как центральная система региона, интегрируя данные из федеральных и региональных государственных платформ, а также взаимодействуя с профильными системами исполнителей и осуществляя мониторинг различных цифровых каналов: социальных сетей, мессенджеров, порталов обратной связи.

Ключевая особенность системы — применение технологий искусственного интеллекта для автоматизации ключевых этапов работы с обращениями граждан. Благодаря внедрённым алгоритмам машинного обучения, «Джинн» осуществляет автоматическую классификацию тематики сообщений, анализирует их содержимое, определяет категорию, территориальную и ведомственную принадлежность обращения. На основании этих данных система не только сортирует и структурирует обращения, но и самостоятельно определяет наиболее подходящего исполнителя или ответственную организацию, обеспечивая интеллектуальную маршрутизацию обращений в соответствующие подразделения. Это позволяет не только минимизировать влияние человеческого фактора, но и обеспечить высокую скорость и точность обработки — вне зависимости от масштаба потока входящих сообщений.

Искусственный интеллект в системе «Джинн» реализует не только распознавание тематик, но и выявление острых проблем, трендов, повторяющихся жалоб, а также может использоваться для формирования типовых ответов, персонализированных уведомлений и автоматизированного взаимодействия с гражданами через чат-ботов и интегрированные сервисы или напрямую в целевые платформы, откуда пришло сообщение.

Кроме того, система поддерживает мультиканальность, что означает интеграцию с различными источниками, включая социальные сети, мессенджеры и порталы государственных услуг. Это позволяет органам власти работать с гражданами через те каналы, которые наиболее удобны для пользователей, обеспечивая полный охват коммуникационных платформ.

Дополнительно, система «Джинн» разработана с учётом современных архитектурных подходов и может быть развернута не только как полнофункциональная платформа с пользовательским интерфейсом, но и в виде отдельного микросервиса. Такой режим особенно востребован в случаях, когда необходима интеграция исключительно интеллектуальных функций — автоматической классификации сообщений и назначения ответственных — во внешние информационные системы или корпоративные решения. В этом случае все взаимодействие осуществляется через API: внешние системы могут передавать обращения на анализ, получать классификацию, маршрутизацию и другие метаданные, не используя UI-платформы.

Кроме интеллектуального ядра, «Джинн» предоставляет развитые инструменты для информационно-аналитической работы: все данные и результаты анализа доступны в виде наглядных дашбордов, а формируемые отчёты позволяют в любой момент оценить эффективность работы и выстроить стратегию дальнейших улучшений.

Ключевые возможности системы

«Джинн» предлагает следующие функциональные возможности:

  • Сбор и мониторинг сообщений: Система автоматически собирает сообщения из социальных сетей и мессенджеров, обеспечивая непрерывный мониторинг активности граждан.

  • Нормализация сообщений: Все собранные сообщения нормализуются в формат, удобный для последующей обработки исполнителями.

  • Классификация запросов: Сообщения автоматически классифицируются по типам (предложение, жалоба, запрос услуг, неконструктивные сообщения и др.) и распределяются по более чем 1000 тематическим категориям.

  • Гибкость классификаторов: Поддержка изменения классификаторов категорий и тем без необходимости полного переобучения модели, что позволяет системе адаптироваться к новым задачам.

  • Определение тональности сообщений: Система анализирует тональность каждого сообщения (позитивная, негативная или нейтральная), что помогает более точно реагировать на запросы граждан.

  • Определение адресата: Система автоматически определяет организацию и ответственного исполнителя, которому должно быть направлено сообщение.

  • Интеграция с профильными системами: Поддерживается передача данных, включая статусы, сроки и другие параметры, в профильные системы органов власти для оперативной обработки запросов.

  • Контроль сроков и качества: «Джинн» контролирует сроки обработки сообщений и качество предоставленных ответов, обеспечивая соответствие стандартам реагирования.

  • Автоматизированные ответы и генерация контента: «Джинн» использует базу знаний компании для подбора готовых ответов на типовые вопросы. Также система способна генерировать наиболее релевантные ответы на основе ранее предоставленных ответов на похожие сообщения, что значительно снижает нагрузку на модераторов и ускоряет процесс реагирования.

  • Информационно-аналитические инструменты: Система предоставляет инструменты для проведения информационно-аналитической работы. Результаты анализа представлены в виде наглядных дашбордов и экспортируемых отчетов, формируемых для различных интервалов времени (день, неделя, месяц). Это позволяет органам власти оперативно оценивать эффективность своей работы и принимать обоснованные решения.

Основные роли присутствующие в системе:

Роль

Описание и основные функции

Автор

Описание: Пользователь, оставляющий сообщение. Не имеет доступа к системе (условная роль).

Основные функции: Создание и отправка сообщения через внешние каналы (социальные сети, мессенджеры и т.д.).

Исполнитель

Описание: Пользователь, ответственный за обработку и решение проблемы, поступившей в систему.

Основные функции: - Просмотр и принятие сообщений в работу. - Обновление статусов сообщений. - Взаимодействие с заявителями для уточнения информации. - Закрытие сообщений после решения. - Формирование отчетов по обработанным сообщениям.

Администратор

Описание: Пользователь, управляющий системой и обеспечивающий ее стабильную работу.

Основные функции: - Управление пользователями (создание, редактирование, удаление учетных записей). - Назначение ролей пользователям. - Настройка системы классификации сообщений. - Управление интеграцией с внешними системами. - Настройка отчетов и автоматических уведомлений. - Обеспечение безопасности данных и управление доступом. - Мониторинг системы и решение технических проблем.

Координатор

Описание: Пользователь, контролирующий правильность обработки и верификации сообщений.

Основные функции: - Проверка и верификация сообщений. - Удаление или редактирование неподобающих сообщений. - Обеспечение точности классификации сообщений. - Взаимодействие с заявителями для уточнения деталей.

Многообразие источников

Система поддерживает интеграцию с неограниченным количеством источников сообщений в социальных сетях и мессенджерах. Это могут быть личные переписки, публичные страницы, страницы групп и другие каналы, что позволяет охватывать широкий спектр взаимодействий с гражданами. «Джинн» обеспечивает сбор данных из различных источников, что делает её ключевым инструментом для обеспечения эффективного взаимодействия между органами власти и гражданами через цифровые платформы.

Источники мониторинга
Источники мониторинга

Система объединяет различные способы сбора сообщений:

  • Социальные сети (например, ВКонтакте, Одноклассники, Telegram);

  • ПОС ЕПГУ (Портал государственных услуг);

  • Инцидент-менеджмент;

  • Региональные системы сбора сообщений и обращений жителей;

  • Интеграция с чат-ботами для автоматизации общения с гражданами;

  • Обращения по телефону, что расширяет доступность системы для граждан, не использующих интернет.

Источники интеграции
Источники интеграции

Бизнес-процесс

Основные этапы бизнес-процесса системы строятся на последовательной автоматизации и контроле качества обработки обращений граждан:

  1. Мониторинг и сбор данных. На первом этапе система с помощью специализированного краулера непрерывно отслеживает заранее определённые источники данных — социальные сети, мессенджеры, порталы и другие цифровые каналы. Все новые сообщения и обращения автоматически попадают в систему для дальнейшей обработки.

  2. Классификация и анализ. После поступления в систему каждое сообщение проходит автоматическую классификацию с использованием алгоритмов машинного обучения. Модель определяет тематику, категорию, приоритет и другие ключевые параметры обращения. Важной особенностью является то, что если искусственный интеллект не уверен в результате (например, наблюдается неоднозначность классификации), то такое сообщение автоматически отправляется на ручную модерацию. В системе предусмотрен удобный инструмент для редактирования и доопределения таких обращений модератором.

  3. Назначение задач. На основе результатов анализа система автоматически назначает исполнителя — конкретное лицо или подразделение, учитывая тематику обращения, срочность, региональную принадлежность и компетенции сотрудников. Механизм назначения задач может корректироваться модераторами в ручном режиме, если автоматический выбор был неудачным.

  4. Обработка и реагирование. Исполнитель начинает работу с обращением, отслеживает прогресс выполнения через встроенные инструменты системы, может запросить дополнительную информацию у гражданина. После решения проблемы формируется ответ, который передаётся обратно заявителю.

  5. Отслеживание и обновление статусов. Система прозрачно ведёт все этапы обработки обращений — от поступления до решения, с обновлением статусов ("в работе", "на уточнении", "на модерации", "решено" и др.). Это позволяет заявителю видеть, на каком этапе находится его обращение.

  6. Аналитика и отчетность. На завершающем этапе система автоматически собирает статистику по ключевым параметрам — время реакции, распределение по темам, эффективность исполнителей и др. Все данные визуализируются на дашбордах, доступны для анализа и формирования отчётов в различных разрезах.

Важно отметить, что после ручной модерации и корректировки ошибочно классифицированных сообщений они используются для дообучения нейросетевой модели. Благодаря такому механизму система постепенно повышает свою точность, уменьшая долю обращений, требующих ручной проверки. Инструмент модерации становится не только средством контроля качества, но и ключевым элементом адаптивного самообучения платформы.

Аналитика 1
Аналитика 1
Аналитика 2
Аналитика 2
Аналитика 3
Аналитика 3
Аналитика 4
Аналитика 4

Этот процесс позволяет обеспечить максимальную прозрачность, контроль и эффективность обработки сообщений, что значительно улучшает взаимодействие с гражданами и повышает их удовлетворенность качеством обслуживания.

2. Технологическая основа системы «Джинн»

В технологической основе платформы «Джинн» лежит использование современных нейросетевых моделей на базе архитектуры трансформеров, которые обеспечивают высокую точность автоматической обработки и классификации текстовых сообщений. Применение трансформеров позволяет эффективно анализировать структуру и смысл поступающих обращений, выявлять их тематику, приоритет и другие параметры, необходимые для интеллектуальной маршрутизации.

В системе также используется граф знаний, который служит вспомогательной основой для организации семантических связей между категориями, тематическими областями и другими сущностями. Такой подход позволяет платформе гибко адаптироваться к новым задачам, поддерживать расширение базы знаний и проводить дообучение моделей на основе реальных данных, поступающих в процессе эксплуатации системы. Это обеспечивает устойчивое повышение точности, масштабируемость и возможность быстрого внедрения новых функциональных возможностей в зависимости от запросов заказчика и особенностей отрасли.

Применяемые методы NLP в системе «Джинн»

Для классификации сообщений по типам и тематикам, а также для кодирования терминов, представленных в виде графа знаний, в системе «Джинн» используется модель mDeBERTa-v3.

mDeBERTa-v3 (Multilingual DeBERTa) — это улучшенная версия модели DeBERTa (Decoding-enhanced BERT with disentangled attention). Модель отличается использованием "разделённого" внимания (disentangled attention), что позволяет более эффективно учитывать позиционные и контекстные зависимости в тексте. Также модель включает относительные позиционные векторы и механизм маскирования для улучшения представления семантики предложений.

Основные преимущества mDeBERTa-v3:

  • Высокая точность в задачах классификации текста и тематической категоризации.

  • Модель обучена на большом объеме данных на разных языках, что делает её эффективной для анализа сообщений с разной лексикой и стилистикой.

  • Гибкость в использовании для различных задач NLP, включая тематическую классификацию и кодирование понятий.

Применение в системе «Джинн»:

  • Классификация сообщений по типам (например, устранение проблемы, информационный запрос, критика власти) и по тематикам (ЖКХ, медицина, транспорт и т.д.).

  • Кодирование терминов, представленных в виде графа знаний, что позволяет эффективно организовывать семантические связи между тематиками и категориями сообщений.

Источник: mDeBERTa: Microsoft

Определение адресов, топонимов и географических объектов

Для автоматического извлечения топонимов, географических объектов и других адресных данных из сообщений используется модель mdeberta-v3-base-squad2. Эта модель обучена на задаче вопросов и ответов (question answering) с использованием датасета SQuAD 2.0.

SQuAD 2.0 — это датасет для задачи извлечения ответов на вопросы, где модель должна не только находить ответы в тексте, но и определять, если ответа на заданный вопрос в тексте нет. Это делает её особенно полезной для обработки сообщений граждан, где могут встречаться как явные, так и скрытые упоминания адресов или объектов.

Применение в системе «Джинн»:

  • Извлечение адресов и топонимов из текстов сообщений.

  • Локализация объектов сообщений для правильного назначения исполнителей (например, определение населённого пункта или улицы, упомянутой в сообщении).

Источник: mdeberta-v3-base-squad2

Генерация релевантных ответов

Для генерации релевантных ответов на сообщения граждан в системе используется современная языковая модель DeepSeek-Qwen1.5 или Llama 3, дообученная на данных реальных обращений и ответов исполнителей. Обучение проводится с применением технологии LoRA (Low-Rank Adaptation), что позволяет быстро и эффективно адаптировать модель под специфику запросов и коммуникационных стандартов заказчика. Такой подход обеспечивает формирование релевантных и контекстных текстов в автоматическом режиме с возможностью последующей корректировки модератором или сотрудником.

Система мониторинга и сбора сообщений

В системе реализован механизм сбора сообщений — краулер, который настроен на определённые источники (например, страницы в социальных сетях или каналы в Telegram). Краулер с заданной периодичностью сканирует источники, проверяя новые посты и комментарии на наличие сообщений, которые могут быть интересны для обработки. Новые данные автоматически добавляются в систему. Алгоритм обхода краулера включает систему приоритетов, которая позволяет уделять больше внимания важным источникам, не забывая при этом периодически проверять более старые публикации. Это позволяет краулеру отслеживать сообщения, опубликованные в течение последних 30 дней.

После того как сообщение попадает в систему, оно проходит первичную обработку. Нейронные сети анализируют текст сообщения для определения упоминаемого адреса (если гражданин указывает местоположение). Затем система определяет координаты этого адреса, что позволяет локализовать объект сообщения. Каждое сообщение классифицируется по тематике с использованием графа знаний, основанного на семантической модели. Сначала терминологический анализ преобразует текст сообщения в эмбеддинги, что позволяет системе классифицировать тип сообщения (например, устранение проблемы, комментарий, запрос информации), затем определить его тематику (например, ЖКХ, медицина, дороги). На основе этих данных определяется ответственный исполнитель.

Обработанное сообщение затем поступает в систему, где соответствующий исполнитель получает уведомление о новом обращении. Исполнитель может начать решать проблему или запросить дополнительную информацию у заявителя. После завершения обработки, ответ направляется на ту платформу, с которой было получено сообщение, чтобы проинформировать гражданина о решении. Принятый подход позволяет организовать оперативное и эффективное взаимодействие, обеспечивая двустороннюю связь между органами власти и гражданами.

Список сообщений
Список сообщений
Окно работы с сообщением
Окно работы с сообщением

Техническая архитектура

Программное обеспечение «Джинн» построено по принципу клиент-серверного приложения, состоящего из клиентской и серверной частей. Клиентская часть реализует пользовательский интерфейс для взаимодействия с сервисами, а серверная часть включает:

  • Модуль сбора и обработки внешней информации (Краулер): Отвечает за мониторинг и сбор сообщений из различных источников.

  • Модуль обработки данных: Включает алгоритмы машинного обучения и нейронные сети для классификации, анализа и распределения сообщений

Технологический стек

Описание

Архитектура веб-приложения

Многоуровневая архитектура с использованием MDM хранилища (НСИ) для унификации данных системы

Машинное обучение

PyTorch — для разработки и тренировки адаптивных нейронных сетей

Backend

- Python и Django — для серверной логики - Django-REST — для построения RESTful API

Frontend

- HTML5, CSS3, JavaScript (ES6) — для базового дизайна - React — для интерактивных интерфейсов

СУБД

- SQL (PostgreSQL или MySQL) — для хранения структурированных данных - noSQL (Redis) — для управления данными в реальном времени

Поисковая система

Elasticsearch — для расширенного поиска и аналитики

Веб-сервер

Nginx — для обработки запросов к серверу

Виртуализация

Docker — для создания, развертывания и управления контейнерами

Безопасность

Использование Astra Linux и РЕД ОС для обеспечения безопасности и разграничения доступа

3. Примеры внедрения и достигнутые результаты

Пилотная версия системы «Джинн» была успешно внедрена в Белгородской области. В ходе пилотного проекта система продемонстрировала достойную эффективность мониторинга и обработки сообщений из социальных сетей, в частности из социальной сети ВКонтакте.

Основные параметры внедрения

  • В качестве источников мониторинга было выбрано 392 группы и страницы в социальной сети ВКонтакте со всего региона.

  • Приоритетные группы и страницы отслеживаются с интервалом в 10 минут, что позволяет оперативно получать и обрабатывать новые сообщения.

  • Система покрывает последние 30 дней активности, анализируя посты и комментарии в зависимости от их актуальности, количества лайков и охвата аудитории.

  • Алгоритм мониторинга работает по системе приоритетов: чем старше пост, тем меньше вероятность его просмотра системой.

  • В систему интегрировано 65 организаций, включая как региональные министерства, так и муниципальные администрации.

Точность классификации и определения исполнителя

Система «Джинн» также продемонстрировала высокие показатели точности в классификации сообщений и распределении их между ответственными исполнителями:

  • Точность определения типа сообщения (например, жалоба, предложение, запрос услуг) составляет 86,6%.

  • Точность определения категории сообщения достигает 92% на уверенных ответах, покрывая 60% данных. Если система не уверена в классификации, включается система правил на основе ключевых терминов, что позволяет улучшить результаты.

  • Точность определения ответственного исполнителя составляет 81,3% на уверенных ответах, охватывая 58% данных. В случае неопределенности системы также активируется система правил для корректировки назначения.

Разработанная система правил используется для достижения достаточного объема данных для дальнейшего обучения моделей. По мере накопления датасета и дообучения модели точность работы системы будет продолжать повышаться.

Достигнутые результаты

В среднем за месяц система обрабатывает около 200 тысяч сообщений. Внедрение позволило значительно сократить время на мониторинг и классификацию сообщений, повысив оперативность взаимодействия с гражданами и качество работы с обращениями.

Статистические данные

Показатель

Значение

Количество мониторируемых групп/страниц в ВК

392

Интервал мониторинга приоритетных групп

10 минут

Покрываемый период активности

30 дней

Количество организаций, подключенных к системе

65

Среднее количество обрабатываемых сообщений в месяц

200 000

Точность определения типа сообщения

86,6 %

Точность определения категории сообщения

92 % (покрытие 60 % данных)

Точность определения ответственного исполнителя

81,3 % (покрытие 58 % данных)

Заключение

Результаты внедрения системы «Джинн» говорят сами за себя: несмотря на то что автоматическая обработка сообщений пока не совершенна, платформа уже сегодня закрывает основную часть рутинного ручного труда и существенно ускоряет процессы работы с обращениями. По отзывам участников пилотных проектов, особенно ценным оказался отказ от необходимости вручную мониторить паблики и сообщества — все релевантные сообщения автоматически собираются, классифицируются и доставляются ответственным исполнителям, зачастую напрямую в Telegram-канал. Это принципиально упрощает рабочие процессы, высвобождает время сотрудников и позволяет органам власти значительно быстрее реагировать на обращения граждан, повышая качество и прозрачность обратной связи.

Важным преимуществом системы является поддержка дообучения на реальных данных: обработанные и скорректированные вручную сообщения используются для повышения точности моделей, что постепенно снижает потребность в ручной модерации и повышает степень автоматизации системы.

Контакты

Контакт

Информация

Телефон

+7 (980) 386-37-00 +7 (4722) 36-37-00

Почтовый ящик

team@infolabs.ru

Официальный сайт

https://infolabs.ru/

Вопросы и замечания

Telegram: @antonSHBK

Комментарии (0)