AI Legal веб-сервис для тех, кто устал гадать
«Шемякин суд» - это не просто избитый фразеологизм, но реальность для многих, кто ввязался в судебную тяжбу, не оценив заранее все риски. Тысячи проигранных дел, потраченные нервы и деньги — всего этого можно было бы избежать, задай истец себе вовремя один простой вопрос: «Каковы мои шансы?».
“неШемяка!” - это маленькое веб‑приложение, которое пытается ответить на один простой вопрос, есть ли хоть малейший смысл подавать иск, это сервис, который пытается отличить перспективное дело от заранее проигрышного.
Эта статья - немного про архитектуру сервиса, но, в первую очередь, про путь: от разработчика до выпускника юрфака МГУ, который через десять лет успешной судебной практики вернулся обратно в код. И который, случись тут недельный отпуск, решил автоматизировать рутину первичной оценки исков.
От разработки к юрфаку, или туда и обратно
До юрфака была разнообразная, в том числе и айтишная биография: были и код, и проекты, и продакшн…. Потом случился юридический факультет МГУ, и написание кода сменилось на написание исков, жалоб, возражений - десять лет полноценного litigation..
Так бывает, что захотелось в ту же реку войти дважды - и неожиданно для себя оказался опять в разработке: никто же не обещал, что род занятий нужно выбирать один раз и навсегда.? При этом живая судебная практика дает редкий для разработчика навык — быстрое погружение в предметную область. Приходит клиент, и за несколько часов нужно разобраться в контексте, помочь принять важное решение, а, иногда, на следующий день оказаться в судебном процессе. Так что возвращение в it было веселым и закончилось solution архитектурой и в-свое-удовольствие бэкендом.
Боль: сколько стоит честный взгляд на иск
Любой практикующий юрист знает несколько «типовых» сценариев общения с клиентом, который пришел с готовым иском или уже находится в судебном процессе: сомнительный иск, тонны ненужных доказательств, и всего один вопрос - “да или нет?”, есть ли шанс на победу в “таком простом” деле. Для честной оценки нужно вникнуть в тексты, ужаснуться, основательно покопаться в свежей практике, соотнести ее с фактами, оценить доказательственную базу, опять ужаснуться, и аккуратно объяснить клиенту, почему его «железобетонное дело» таковым не является.
Это занимает часы, а иногда и дни, и, как правило, плату за это в наших палестинах никто не берет. В реальности либо юрист работает в минус «для привлечения клиента», либо дает поверхностный ответ, либо вообще отказывается от дешевой первичной оценки, чтобы не превращать практику в бесплатную горячую линию.
И вот здесь логично спросить, а почему бы не поручить первичный черновой разбор этих материалов элэлэмам. Тем более, что некоторые из них специально тестируются на предмет такого рода разборов, существуют знаменитые метрики, бенчмарки (см. предыдущие наши старые публикации).
ИИ‑оценка иска за 100 ₽ (или бесплатно)
Так родился «неШемяка!» - веб‑сервис, который берет на вход текст искового заявления, либо даже просто описание дела, и возвращает консенсусный прогноз: вероятность удовлетворения иска, степень достоверности (confidence score), короткое обоснование и формализованный список рекомендаций по усилению позиции.
Монетизации тут никакой нет. Базовый анализ - бесплатный, премиум‑анализ — символические 100 руб, чтобы отсечь баловство.
LLM, конечно, опенроутеровские и разные: для базового анализа - бесплатные, для “премиум” - последние GPT, Sonnet, Gemini и др. Выбор моделей, наверное, самая интересная исследовательская часть. Для валидации собрал тестовый датасет из 200+ исковых заявлений и соответствующих им судебных решений (российских, разумеется), размеченных удовлетворено/отказано. По нескольку раз прогонял сначала через десять, а потом через пять разных LLM, замеряя accuracy. Результаты потрясают (например, стабильная разница в 20-25 процентных пунктов между лучшей и худшей моделями), причем ценовой фактор никак не коррелирует с точностью. Методологию тестирования и сравнительную таблицу постараюсь скоро опубликовать.
Архитектура: минимализм на Go и HTMX
Хотелось сделать сервис, который можно поднять на простом VPS без зоопарка сервисов, поэтому архитектура намеренно минималистичная. Бэкенд - нативный Go без фреймворков - только net/http и http.ServeMux, а все статические файлы и шаблоны в бинарник через go:embed.
Стек выглядит так:
Язык: Go 1.25+ с упором на простоту
HTTP: стандартный net/http + http.ServeMux, без сторонних роутеров
Шаблоны: html/template, модульная структура с layouts/pages
Frontend: HTMX для минимальной интерактивности, никаких фронтенд‑монстров
БД: PostgreSQL на минималках (SQLite хорош, но потом же мигрировать придется)
Итого три докер контейнера: бинарник, nginx (так спокойнее) и db.
Без регистрации, но с максимальной честностью
Принцип, который хотелось сохранить из юридической практики, - честность по поводу границ сервиса. “неШемяка!” ничего не гарантирует, не заменит юриста (на двух страницах сто пятьсот соответствующих предупреждений), но честно делает только два шага: технологическая оценка шансов на основе представленного текст искового заявления и сопутствующих материалов и список пунктов, которые стоит усилить. Отсюда вытекают продуктовые решения:
никакой регистрации - только email для премиум‑анализа, чтобы выдать magic link,
автоудаление документов через 48 часов,
требование к пользователям вручную анонимизировать персональные данные.
Юристу “неШемяка!” не конкурент, а источник второго, третьего, десятого экспресс ИИ-мнения.
При этом из моделей сервис старается выжать максимально формализованный ответ. Здесь еще огромное поле для рефакторинга. За детальным анализом, конечно, стоит напрямую идти в OpenAI, Claude, Grok, а лучше - в Perplexity.
Что дальше
Текущая версия - это рабочий MVP с базовым и премиум прогнозом и минимальной платежной логикой. Понятно, что сам сервис можно будет еще докручивать: импорты, парсинги доков, экспорты, кропотливая работа над confidence score, тюнинг системы промтов, эмбеддинги и раги, надеюсь дойдут руки и до Russian LegalBench, о котором уже писал на хабре, - рейтинг моделей на базе отечественного материала (здесь, кстати, несколько неожиданных открытий).
Но глобально, есть еще несколько более серьезных Legal Tech‑задумок, от которых дух захватывает. Все это подождет следующего отпуска…
Вместо послесловия
Десять лет судебной практики учат одному: в праве слишком много человеческого, право остается, как сказал один умник, “метафизикой человеческого выбора”, делая который живой человек берёт на себя риск, вину и нечетко формализуемую ответственность перед другими, чего не сделает ни один ИИ. Но преодолеть юридическую рутину, оценить, “стоит ли вообще ввязываться”, машинка, как кажется, научилась.
На всякий случай. Этот проект не про коммерцию, а про пользу - если будет ее хоть немного значит неделя с “неШемякой!” была потрачена не зря. Ole Mary Todd's callin', so I guess it must be time for bed… Всем пока!
PS
Рад буду всякой критике, чем жестче, тем лучше. Комментарии, багрепорты, предложения - сюда или в tg: @neshemyaka_chat
PPS
Комментарии (21)

morginalium
20.11.2025 12:13Получилось классно. Будете дообучать модели? Или делать поиск по базам судов?

larayoda Автор
20.11.2025 12:13спасибо!!! планов много, сначала в части скоринга, потом может быть и дальше удастся продвинуться

aborouhin
20.11.2025 12:13Есть уже коммерческий продукт от разработчика, который имеет доступ к базам судов (в отличие от простых смертных), который такую же задачу решает. Не могу оценить, насколько качественно, т.к. скептически отношусь к задаче в целом (см. ветку комментов ниже). В любом случае, с текущим плачевным состоянием открытости данных судебной системы шансов что-то конкурентоспособное создать независимому разработчику, увы, мало.

shanker
20.11.2025 12:13с текущим плачевным состоянием открытости данных судебной системы шансов что-то конкурентоспособное создать независимому разработчику, увы, мало.
А чего не хватает? Чтоб была открыта вся база какого-нибудь http://sudact.ru ? Мне кажется, это хоть и было бы полезно, но можно начать со сбора всех Постановлений Президиума\Пленума Верховного Суда (вот они) + и обзора практик Конституционного Суда (вот он). А ещё можно через gau собрать ссылки с pdf с сайта КС РФ (или web.archive.org - когда он "оживёт"). А брать решения нижестоящих судов - такое себе: они могут там всяких небылиц насочинять. Я уже приводил пример решения по личному иску. ИИ и так ругают за галлюцинации. Хотите, чтоб этих галлюцинаций стало больше? :)

larayoda Автор
20.11.2025 12:13первая инстанция - самая интересная, там как раз много человеческого. ras.arbitr.ru - парсить сложновато, но можно. впрочем, видел у парсинг-компаний их базу в продаже, но пока не приценивался

aborouhin
20.11.2025 12:13То что на уровне высших инстанций как-то отрегулировано, опытный юрист (в своей сфере) и без всяких LLM оценит с первого взгляда. Сложные случаи требуют копать всю базу. Причём найдя прецедент в ккссации, потом лезешь в решение первой инстанции за подробностями.

aborouhin
20.11.2025 12:13Хм. Чтобы оценить вероятность выигрыша дела, в большинстве случаев надо сначала вынести весь мозг заказчику, чтобы он понял, какие документы он должен предоставить, какие факты рассказать и какие пояснения дать. Собственно поэтому, как верно замечено в начале статьи, это и занимает столько времени. А то ТЗ / описание иска, которое заказчик способен сам составить на входе, чаще всего оказывается, мягко говоря, односторонним и идеализированным взглядом на дело, и хоть LLM его скорми, хоть живому юристу (без возможности задать уточняющие вопросы) - оценка будет далека от истины.

larayoda Автор
20.11.2025 12:13Вы правы. Но с исками уже можно работать. была статья, как китайцы прогнали 50 тыс исков через сверточную (!) модель и добились определенного успеха -

aborouhin
20.11.2025 12:13Я с трудом себе представляю бизнес-процесс, в котором текст иска появляется раньше оценки перспектив дела. Разве что иск был составлен неким другим, не вызывающим доверия, юристом. Но в таком случае странно полагаться и на то, что этот юрист адекватно определил предмет доказывания и собрал корректный пакет документов / фактических обстоятельств.

shanker
20.11.2025 12:13Автор немножко опоздал. Из источника:
Yandex b2b Tech запустил ИИ-помощника для юристов. Он обучен на российском законодательстве и судебной практике.
«Нейроюрист» умеет работать в том числе с PDF-файлами, презентациями, изображениями, аудио- и видеозаписями. Он также может анализировать договоры и сопоставлять разные версий одного и того же документа

shanker
20.11.2025 12:13Для валидации собрал тестовый датасет из 200+ исковых заявлений и соответствующих им судебных решений (российских, разумеется), размеченных удовлетворено/отказано.
Напишу с опыта своей самостоятельной юридической практики (ГПК, КАС, УПК). Какая-то средняя температура по больнице получается. Хотя бы на обзорах практики Верховного Суда и Конституционного Суда было бы класс. А ещё лучше - на всех решениях КС и Постановлениях Президиума ВС. Кстати, можно просто отдельный поиск по этим материалам - "для продвинутых".
Иначе - нужно помнить, что решения судов... как бы так помягче сказать... не всегда выдерживают критику. Один судья одно решит, другой - другое. Ещё до кучи не напишут каким законом они руководствовались (здесь хочется передать "привет" всем этим писателям "обзора практики кассационных судов общей юрисдикции"). Я чего только не читал в решениях по своим делам. Из последнего - кассационный суд общей юрисдикции:
суд считает возможным рассмотреть дело в отсутствие неявившихся лиц, не усмотрев оснований для отложения судебного разбирательства и удовлетворения ходатайства истца о его участии в онлайн-заседании посредством веб-конференции.
У нас, конечно, очень мало практики в части применения статьи 155.2 ГПК РФ. Но, чтоб не париться и не указывать основания для отклонения ходатайства (как того требует закон) - это сильно.

larayoda Автор
20.11.2025 12:13Конечно, человеческое всегда сложно формализуемо, и больших надежд на нейронки тут нет. Впрочем, как и на людей)) Но в планах - копнуть и в этом направлении. Сейчас, вечерами, ставлю небольшие эксперименты в части «нейро-профиля» конкретных судей на основе решений. При подмешивании этого в контекст запросов (эмбединг, раги, промпт - все как обычно) интересные штуки выясняются.

ENick
20.11.2025 12:13"«нейро-профиля» конкретных судей на основе решений " - с огнём играете... Если развить этот алгоритм, много чего интересного можно будет узнать

Arhammon
20.11.2025 12:13Есть еще один фактор, не все конфликты доходят до суда - живой юрист(или даже человек просто практически связанный с темой спора) имеет подобную практику и знает где могут дать заднюю. И здесь поиск по судакт или ИИ не сильно поможет...
Kamil_GR
Если я правильно понимаю, вы засовываете документы клиента в LLM и отдаете ее ответ клиенту?
Судя по всему, это именно так и есть. Один вопрос, а зачем клиенту в этой цепочке веб?
randomsimplenumber
Тссс.. не палите схему..
larayoda Автор
Абсолютно в точку! Это просто дружелюбная (надеюсь) обертка над ллмками, плюс предварительный скоринг моделей, консенсус скоринг по итогам, и максимальная лаконичная упаковка. В самой заметке же предлагаю ходить в перплексити, гпт и клод.