image

«Судья удалился в свой кабинет и сел в кресло за письменным столом. Там он с помощью штепселя под мышкой подключился к компьютеру…»

Ф. Чиландер, рассказ «Судебный процесс»


Технологии больших данных и их анализа сейчас интегрируются практически во все сферы деятельности: от таргетированной рекламы и алгоритмов предложки Netflix, до умных систем снижения потребления энергии дата-центрами и сокращения выбросов вредных отходов в атмосферу. Добрался тренд и до такой консервативной и традиционно человеко-бумажной сферы как правосудие. Министерства юстиции всех стран начали активно думать над тем, как использовать новые технологии для оптимизации судебной системы и решения извечной проблемы загруженности судов (проблема общая для всех стран — достаточно почитать научную аналитику или простые отзывы в Google.Maps и Яндекс.Карты).

Особое внимание Фемида обращает на прогнозную аналитику, которая образовала костяк новой концепции предиктивного правосудия. Полицейским такие алгоритмы позволят выделить в режиме реального времени места наиболее вероятного совершения преступлений и улучшить модель патрулирования.

А вот для судей предполагается еще больший спектр возможностей. Алгоритм может дать прогноз относительно того, с какой вероятностью подсудимый совершит в будущем новое преступление (рецидив) — на основе этой информации судья сможет точнее определить стоимость выпуска его под залог или размер назначаемого ему наказания. ИИ также сможет посчитать, какое в среднем наказание назначается преступникам при аналогичных обстоятельствах — и дать соответствующую рекомендацию судье, чтобы тот видел «золотую середину».

Воплощение этих идей требует вдумчивого подхода к подготовке и выборке данных. На вопрос о том, чем кормить судебные нейросети, США и Германия дают разные ответы.

США: используем данные об уже осужденных


Американцы предлагают обучать нейросети на выборках статистических данных об уже осужденных лицах. Уже двадцать лет в США все осужденные заполняют многостраничные анкеты с вопросами об их прошлом, окружении, образовании и семейной жизни. Все эти анкеты собираются и обрабатываются в рамках проекта «Переработанная оценка уголовно-исполнительной инспекции» (Level of Service Inventory-Revised, сокр. LSI-R).

Далее эти данные структурируются в две группы. Первая группа – криминальная история. В нее входят собранные сведения о предыдущих арестах осужденных, их судимостях, неявках в суд, преступлениях, совершенных после отсидки и т.д. Вторая группа – социально-демографические характеристики: возраст, пол, занятость, резидентство и гражданство осужденных.

Нейросеть ищет как внутригрупповые, так и межгрупповые корреляции. На основе этих корреляций впоследствии делается прогноз совершения конкретным лицом преступления в будущем (рецидива). Отсюда и название таких алгоритмов — recidivism models. Представим знакомую сцену из американских сериалов-процедуралов: перед судьей предстает белый мужчина средних лет, одинокий бухгалтер, обвиняемый в мошенничестве. Пропустив его данные через программу, судья видит результат: риск того, что такой человек совершит преступление повторно очень низок, соответственно, ему можно назначить наказание «по нижней планке». Конечно, это грубый пример — предполагается, что алгоритмы смогут сориентировать судей и в более сложных ситуациях, когда по человеку и преступлению оценить риск очень сложно.

Иными словами, при разрешении конкретного дела алгоритм будет рекомендовать применять такой размер наказания, при котором у людей, обладающих сходными характеристиками с подсудимым, был зафиксирован минимальный риск совершения рецидива.

Recidivism models уже применяются в 24 штатах США. Их рекомендации, однако не носят для судей обязательного характера, они вправе использовать их как дополнительного помощника, принимая решение самостоятельно.

С одной стороны, американский подход выглядит логичным: алгоритм может учесть больше факторов, чем судья, да и опирается только на статистический данные. Судья же может подсознательно симпатизировать парню, напоминающего его самого в юности, или, наоборот, чувствовать антипатию к женщине-подсудимой, похожей на ненавистную ему тещу.

С другой стороны, существуют и очевидные минусы. Так как первоначальная выборка данных ограничивается только осужденными, анализ не будет учитывать показатели нераскрытых преступлений и преступлений, которые хоть и были совершены, но не были известны полиции (т. н. латентные). Более того, по одним категориям преступлений полиция может более активно упекать за решетку определенную группу людей (например, афроамериканцев за наркоторговлю), чаще игнорируя совершение этих же преступлений другими лицами. Согласитесь, это уже серьезно отражается на точности прогноза.

Еще одна проблема заключается в том, что при определении критериев выборки и обработки данных необходимо находить баланс между прагматизмом программиста и высокими моральными требованиями правосудия. Главным образом это касается темы дискриминации. Так, в результате независимого анализа программы прогноза криминального рецидива «COMPAS» (Correctional Offender Management Profiling for Alternative Sanctions) было установлено, что программа в качестве входных параметров учитывает расу: осужденным афроамериканского происхождения она рекомендует назначить более длительные сроки наказания.

Можно справедливо отметить: что поделаешь, если афроамериканцы статистически совершают преступления чаще? Неужели нейросеть должна просто игнорировать такой параметр? Зачем тогда она нужна, если мы заранее ограничиваем таким образом ее точность? Однако обратная сторона монеты означает согласие ровнять всех под одну гребенку: алгоритм всегда будет оценивать человека через призму поступков похожих на него людей. Справедливо ли это? Возможно, лучше отказаться вообще от идеи recidivism models?

Германия: судебные акты как источник Big Data


Пока американские системы берут за основу статистические данные об уже осужденных людях, немцы рассматривают решения своих судов в роли обучающего материала для нейросетей. Немецкие суды очень скрупулезно и точно описывают все свои выводы в приговорах, поэтому идея проста — извлечь все параметры/выводы из судебных актов, сформировав массивы  больших данных, сделать выборки и приступить к обучению ИИ.

Именно в таком ключе реализуется проект Smart Sentencing Лаборатории Legal Tech Кёльнского университета, осуществляемый при технической поддержке Института интегральных схем общества Фраунгофера.

Основная идея немцев заключается в том, чтобы унифицировать размеры наказания, применяемые разными судами. То есть алгоритм на выходе должен давать судье среднее значение наказания, которое назначили его коллеги человеку со схожими характеристиками за аналогичное преступление. В большинстве случаев речь идет о штрафе, который в Германии применяется как наказание в 70-80% процентов случаев.

Плюс такого подхода также очевиден: никто не останется доволен юстицией, узнав, что парень, укравший у него велосипед получил 2 000 евро штрафа, а его подельник, укравший велосипед соседа, — всего 1 600 евро.

Однако технически такое решение реализовать сложнее: если у американцев данные уже преподносятся в почти готовом виде по проекту LSI-R, то немцам приходится создавать трудоемкую систему экстракции данных из судебных приговоров. Более того, такая система будет зависима не от более-менее объективной статистики, а целиком от самих судей: наметится тренд на ужесточение наказания – он тут же отразится на работе алгоритма. Это, кстати, делает немецкий подход «сугубо немецким»: если применить такие системы в странах с низким количеством оправдательных приговоров и высокими сроками наказания, то оправданий и послаблений в наказаниях не произойдет — алгоритм будет поддерживать состояние системы, полностью зависимый от нее. Да и гарантии того, что ИИ не станет дублировать те же предрассудки судей, также отсутствуют.

Американский прагматизм и немецкое качество


Подходы к прогнозному анализу данных в юстиции сильно отличаются. Американцы прагматично строят свои модели на основе статистических данных, собираемых с тюрем. Немцы уповают на качество своих приговоров и непогрешимость судей. Обе концепции не идеальны и порождают множество вопросов, главный из которых: применим ли вообще анализ больших данных к реальным людям в рамках рассмотрения уголовных дел?

image
Сколько пройдет времени от более длительных сроков латентным рецидивистам до предотвращения преступлений в стиле «Особого мнения»? Скотт Гэллоуэй в книге «Большая четверка» считает, что не так много, если Google обяжут передавать данные поисковых запросов правительству.

Комментарии (4)


  1. teke-teke
    23.02.2022 01:05

    По мне, так немецкий подход можно внедрять постепенно, начиная с процессов, где важно только согласовать меры пресечения. Решения этих судов будут влиять на подобные процессы проходящие без компьютера, и, со временем, по мере накопления опыта в похожих делах, компьютер может расширять компетенцию. Сначала умный поисковик, просто показывающий список похожих дел, подобно поиску по картинкам, затем консультант способный составить результат из этих результатов, а потом, со временем, матрица.


  1. Deosis
    24.02.2022 08:42

    http://samlib.ru/s/shapiro_m_a/uvkultr02.shtml

    Наша Фемида действительно не слепа. Именно поэтому она так эффективна

    Для каждой разновидности преступления составляется среднестатистический
    профиль преступника. А потом, с помощью факторного анализа выясняется,
    какие именно признаки преступника совершившего правонарушение в той или
    иной области являются доминирующими.

    Чем сильнее преступник будет соответствовать этому среднестатистическому
    профилю, тем более строгое при прочих равных наказание ему будет
    положено.


  1. YNK
    24.02.2022 13:06

    А что думают правозащитники о смещении этических координат, когда случаи невинно осужденных бездушный алгоритм причислит к рисковым в отношении повторных преступлений?


    1. cyber_estet Автор
      24.02.2022 15:47

      О, вот это, кстати, тоже хороший вопрос: в идеале система должна учитывать погрешность судебных ошибок, но как это реализовать? Умеренная позиция и США и Европы здесь - ИИ должен использоваться только как рекомендательный инструмент судьи (сверились, посмотрели среднее арифметическое). Но не приведет ли это к тому, что на фоне общей загруженности судьи просто будут автоматом штамповать срок, рекомендованный системой?