В недавней статье Роман Янковский высказал интересные мысли о влиянии ИИ на юриспруденцию. Статья Романа под названием «Что не так с ИИ-юристами» имела как сторонников, так и несогласных.
Я решил написать ответ на статью, где постараюсь развить некоторые из поднятых Романом вопросов и пригласить юридическое сообщество к обсуждению прикладной пользы LLM.
Я решил, что справедливо будет прокомментировать его статью публично.
Дискуссии об ИИ часто сопровождаются антропоморфизацией, приписыванием ему человеческих качеств – от божественных (или чудесных, что обязано сделать жизнь человека лучше и счастливее) до демонических (он нас поработит). Это мешает объективной оценке его возможностей и рисков.
Вместо того, чтобы анализировать каждый конкретный тезис исходной статьи о возможностях и опасностях ИИ, предлагаю сфокусироваться на самом определении искусственного интеллекта. Существует стойкое ощущение, что определение ИИ, на которых базируются многие рассуждения – часто недостаточно верны, и обсуждение вытекающих из него тезисов может оказаться неконструктивным.
В контексте данной статьи под ИИ, а точнее, под большими языковыми моделями (LLM), мы будем понимать системы, обученные на огромном корпусе документов. Они содержат в себе знание о вероятности того следования слов друг за другом, и на основе этого могут подставлять их наиболее вероятном порядке. Это упрощенное объяснение, внутри LLM более сложная математика, но на выходе примерно так это и работает.
Следовательно, нужно обсуждать, как использовать и кого заменит именно такой инструмент в юридической сфере.
Предлагаю немного отвлечься и посмотреть на другие отрасли. Приведу примеры.
Wolfram Alpha – поисковик и математический движок, но он не заменил всех математиков в мире. Вместо этого, математики стали более эффективны благодаря появлению таких инструментов, так как освободилось время на обдумывание путей решения задачи с возможностью более быстрой проверки гипотез и проведения расчетов.
Аналогично, AutoCAD заменил чертежников, которые умели чертить по ГОСТам, но не проектировали, например, механизмы для машин. Сам инженер, который проектировал эти механизмы, остался. AutoCAD лишь автоматизировал рутинную часть его работы. И с каждым выпуском автоматизирует все большую ее часть, являясь средством автоматического проектирования. То есть он не заменил человека, а взял на себя выполнение части функций, повысив эффективность работы человека.
LLM, упомянутая в статье Романа Янковского, это система, которая «вспоминает» информацию. Если работа юриста заключается только в том, чтобы «вспомнить», какие статьи подходят под решение вопроса, и процитировать их, то такая система юриста заменит. Компьютер делает это уже быстрее. В этом случае LLM мультиплицирует тот опыт, которому ее обучил создатель. В нее заложены определенные механизмы поиска, или, скорее, генерации информации на основе имеющихся данных. Она может делать это на порядки быстрее, чем человек.
Если работа юриста заключается в том, чтобы на основании вопроса и контекста найти среди сотен тысяч похожих ситуаций наиболее часто встречающиеся ответы (при условии, что модель обучена на «правильных» данных), то такие специалисты, возможно, тоже будут заменены.
Но я надеюсь, что юристы не отождествляют себя с людьми, которые просто «вспоминают», что они или их коллеги отвечали по заданной ситуации ранее. Они не только ищут информацию в базах знаний. Если юриспруденция – это просто «вспомнить», найти и процитировать, то, возможно, на этом статью можно закончить. Но нет, ведь «юриспруденция – это не про вспомнить статью или правило».
Теперь я хочу обратить внимание коллег на фразы из статьи Романа про ИИ, которые могут (не обязательно, но могут) ввести в заблуждение:
официальные отношения со справочными системами, получение лицензий и т.д. — а ведь ИИ-ассистенты их прямые конкуренты. Короче, договориться может быть сложно и дорого.
Комментарий: наш опыт показывает, что интеграция с такими системами через API вполне возможна. Более того, сотрудничество с провайдерами данных может быть взаимовыгодным: ИИ-помощники получают доступ к актуальной информации, а провайдеры расширяют рынок сбыта своих продуктов.
Как назло, именно новые законы интересуют людей больше всего.
Комментарий: это утверждение слишком общее. Хотя интерес к новым законам, безусловно, существует, большая часть договорной практики основана на уже устоявшихся нормах. Стоит провести исследование, чтобы оценить реальное соотношение запросов, связанных с новыми и существующими законами.
Замена данных, лежащих в основе модели, требует обучения по новой. Это долго, хлопотно и дорого.
Комментарий: современные методы, такие как Retrieval Augmented Generation (RAG) и использование большого окна контекста, позволяют эффективно обновлять знания модели без полного переобучения. Эти технологии активно развиваются, что снижает затраты на актуализацию данных.
Результат модели по умолчанию не будет на 100% правильным и на 100% воспроизводимым.
Комментарий: Что значит по умолчанию? Это будет всегда? Или только в октябре 2024 года? Также необходимо найти ответ на вопрос: какова допустимая погрешность? Необходимы метрики для оценки точности работы LLM в юридической сфере.
Модель не может запрашивать дополнительную информацию у клиента.
Комментарий: Может!
Проблема больших языковых моделей — они 1) никогда не владеют всем нужным контекстом и 2) не могут вытащить этот контекст из клиента.
Комментарий: Слово «никогда» не корректно используется, так как LLM владеет тем, на чем ее обучали и какой контекст подали в запросе.
В них все еще много оценочных терминов и контекста, позволяющего интерпретировать одну и ту же норму по-разному.
Комментарий: это верно, и это отражает сложность юридической практики, ведущейся и человеком.
Моделям без конфиденциальных данных может быть просто не на чем учиться.
Комментарий: Конечно, они могут и будут учиться без конфиденциальных данных, если эти данные не нужны для выполнения конкретной юридической задачи.
По многим отраслям права просто у нас мало данных в открытом доступе.
Комментарий: ограниченный доступ к данным действительно является проблемой как для юристов, так и для разработки ИИ-систем.
Где взять хорошие данные с рассуждениями, образцовые решения судов?
Комментарий: Да, действительно, где? Это важный вопрос для юридической практики в целом, который требует дальнейшего исследования.
В конце статьи Роман сообщил, что «во многих отраслях права ИИ уже очень хорош», «ИИ сильно увеличивает производительность труда юристов — как минимум, в несколько раз».
Роман проделал большую аналитическую работу, которая открывает страницу открытого диалога по вопросам ИИ, с желанием понять юридическую профессию будущего. Роман фактически пригласил меня к диалогу.
Цель данной статьи — не столько полемизировать с Романом Янковским, сколько стимулировать обсуждение важных вопросов, связанных с внедрением ИИ в юридическую практику. Понимание как возможностей, так и ограничений LLM позволит нам эффективно использовать эти инструменты для повышения качества и доступности юридических услуг.
Комментарии (2)
ENick
18.10.2024 17:06Чётко, ясно и конкретно. Основная проблема во внедрении нейросетевых алгоритмов - выверка "баз знаний". Надо законы писать так, чтобы их воспринимали системы семантического поиска, чтобы эмбеддинги были адекватными. Тогда и субъективизм судей будет достоверно ниже, иначе - словоблудие.
PereslavlFoto
Да. Это главным образом про предсказание поведения судьи. А в частностях это про дружбу с судьёй, который спит и видит, чтобы истцы отвязались от него и не тревожили.
( Например, судья способен остановить движение дела, потому что потеряны все приложения к иску. )