Дискриминация в алгоритмах ML существует — и нет, это не либеральные сказки / forpes.ru

Главная
Дискриминация в алгоритмах ML существует — и нет, это не либеральные сказки

Дискриминация в алгоритмах ML существует — и нет, это не либеральные сказки -11

26.03.2021 15:08

EthicAI 19 3600 Источник

Человеческий мозг, как мы все знаем, полон предрассудков. Возникает вопрос: если машинное обучение "живет" за счет того, что очень близко имитирует этот наш мозг, то почему его алгоритмы не могут быть такими же необъективными и проявлять такую же несправедливость? К сожалению, они частенько это и делают.

Давайте расскажем вам как именно.

Машинное обучение (ML) — это очевидно новая звездочка ИТ индустрии. И она уже никуда не денется. Одна из причин, почему ML сыграет (и уже играет) значительную роль в нашей жизни — это успешная интеграция его моделей в большое количество уже существующих систем: социальные сети, шоппинг, здравоохранение и т. д.

В настоящее время в отрасль инновационных технологий хотят идти миллионы школьников, студентов и начинающих специалистов, стремящихся сделать карьеру в этой области. При этом, чтобы успешно обучить следующее поколение профессионалов в этой области, необходимо понять несколько неочевидных сторон машинного обучения.

Давно прошли те времена, когда люди могли слепо доверять программам в получении объективных “рассчитанных” результатов. Алгоритмы машинного обучения не дают простых математических результатов, как это делает калькулятор, а влияют на прогнозы преступной деятельности, медицинские диагнозы и решения о приеме на работу. Поскольку мир всё больше и больше полагается на машинное обучение при принятии важных решений, важно, чтобы мы узнавали о необъективных сведениях, понимали последствия некорректных результатов модели и принимали превентивные меры.

Так какая предвзятость (bias) есть в алгоритмах машинного обучения?

Интеграция машинного обучения в здравоохранение вызвала большие споры, потому что некоторые алгоритмы не могли одинаково лечить всех пациентов. Например, алгоритм обнаружения рака кожи был обучен с использованием данных, включающие в себя в основном фото и информацию о светлых тонах кожи. Следовательно, этот алгоритм был не эффективен при обнаружении рака кожи у людей с более тёмными тонами кожи. Несмотря на то, что у ИИ есть много возможностей повысить доступность медицинских услуг для нуждающихся, важно должны убедиться, что качество медицинской помощи не ухудшается для определенных демографических групп.
Хороший пример необъективности распознавания естественного языка (NLP) можно увидеть в социальных сетях: твиты, написанные афроамериканцами, в среднем отмечены алгоритмами ИИ как оскорбительные (хотя на самом деле таковыми не являются, показатель false positive) в 1,5 раза чаще, чем такие же твиты белых.
Было обнаружено, что даже более серьёзная предиктивная полицейская система неверно оценивает правонарушителей. COMPAS, система искусственного интеллекта, используемая для прогнозирования вероятности совершения преступником другого преступления, оказалась явно настроенной против афроамериканцев. Получилось так, что у афроамериканцев было вдвое больше ложных предсказаний рецидивизма, чем у белых американцев.

Почему эти признаки необъективности существуют?

Модели машинного обучения изучают закономерности в предназначенных для их обучения данных. Таким образом, если набор данных является стереотипным или не разнообразен, модели могут прийти к ложным выводам. Вот несколько примеров потенциальных ошибок обучения (некоторые из которых действительно произошли):

Использование обучающих данных, которые поступают исключительно из источника данных о состоянии здоровья военнослужащих. Поскольку большинство военнослужащих — мужчины, знания алгоритма о здоровье женщин будут ограничены, что в свою очередь приведет к низкой точности алгоритма.
Использование данных, которые навязывают стереотип привязанности одного из полов к ряду обязанностей или занятий. Некоторые модели глубинного обучения связывают мужчину с доктором, а женщину — с медсестрой из-за вектора представления слов, отображающего социальные стереотипы (word embedding).
Использование данных, которым не хватает разнообразия. Да, той самой любимой дайвёрсити. Многие модели распознавания лиц обучаются на данных, которые включают больше белых людей, чем черных. Исследование Тимнит Гебру и Джой Буоламвини показало, что 3 инструмента для распознавания лиц от крупных технологических компаний смогли почти идеально определить пол белых мужчин, а темнокожих женщин определили неверно в 35% случаев. Это может привести к очень серьезным ошибкам правоохранительных органов.

Откуда мы знаем о существовании этой предвзятости?

Признаки предвзятости всплывают, когда мы сравниваем точность с числом ошибок, которые модель имеет в разных группах. Исследование Тимнит Гебру является ярким примером этого: изучая эту статистику, мы можем увидеть, какие демографические группы дискриминируются моделями. Мы также можем проверить количество положительных и отрицательных результатов, проанализировав, имеется ли примерно одинаковое количество людей из разных групп, получивших один и тот же результат от модели.

Какие возможные способы решения этой проблемы существуют?

Препятствие, с которым в настоящее время сталкиваются многие компании, заключается в том, что им необходимо переобучить свои модели. Существует два главных способа для того, чтобы это сделать:

Ликвидация необъективности наборов данных, используемых моделями — это влечёт за собой удаление существующих наборов данных, содержащих стереотипные данные, и создание репрезентации и дайверсити в них, в попытках сделать их более точными.
Устранение необъективности моделей. Это влечёт за собой изменение фактических векторных представлений слов для удаления стереотипной привязки (мужчина = доктор, и женщина = медсестра) при сохранении нужной гендерной информации (мужчина = король, и женщина = королева).

Тема является довольно неоднозначной и вовлекает проблемы целого общества, однако путем дискуссий и компромиссов решение может быть найдено. Если у вас есть опыт с темой Этики в ИИ - будет интересно прочитать о нем в комментариях.

Комментарии (19)

shuhray
26.03.2021 18:29
#22852436
Допустим, негр пишет «Мазафака!», а сказать хочет «Добрый день!»
1. silent_jeronimo
  27.03.2021 22:06
  #22855846
  +1
  Он пишет yo niggers и ему можно, но алгоритм этого не знает
  1. xamdeath
    29.03.2021 18:38
    #22860984
    Но алгоритм не может знать кто это пишет, если это просто текст без доп. информации о написавшем. Так что алгоритм, собственно, прав.
    
    silent_jeronimo
    29.03.2021 20:35
    #22861410
    Именно в этом предполагаю суть проблемы
    
    твиты, написанные афроамериканцами, в среднем отмечены алгоритмами ИИ как оскорбительные (хотя на самом деле таковыми не являются, показатель false positive) в 1,5 раза чаще, чем такие же твиты белых.

numitus2
26.03.2021 18:43
#22852482
Получилось так, что у афроамериканцев было вдвое больше ложных предсказаний рецидивизма, чем у белых американцев.
Осталось понять это в процентах или в абсолютных числах.
1. JohnDidact
  01.04.2021 17:20
  #22873622
  А разница разве есть?)

lrrr11
26.03.2021 18:45
#22852496
бгг, помню как на одном буржуйском сайте борцуны за права негров порвались от задачи "полицейский наряд решает, кого из подозреваемых преследовать — негра или белого. Как они должны поступить при прочих равных, если известно что негры совершают преступления в среднем гораздо чаще белых?".

А как решит эту задачу анонимный автор (или авторка?) статьи?
1. unibasil
  27.03.2021 06:18
  #22853830
  Видимо, сошлётся на предвзятость и bias'ы в постановке задачи. Ну не может же быть такого, чтобы негры совершали преступления в среднем гораздо чаще белых!

Politura
26.03.2021 18:49
#22852508
+6
А ведь на хабре вместо накидывания кликбейтных дискриминаций можно было-бы написать техническую статью про то, что данные в обучающей выборке могут быть несбалансированными, к чему это может привести и о методах, как с этим люди борятся.
Например, на каггле есть задачка про определение фрода с кредитными картами, там эти данные очень несбалансированны: всего 0.17% воровства по отношению к обычным транзакциям. И вместо заламывания ручек на тему дискриминации и воплей о том, что надо-бы привлечь общественность к решению этого вопроса там от разных людей полно статей, как жеж иметь дело с такими данными и сравнение вариантов решений, например вот: www.kaggle.com/dktalaicha/credit-card-fraud-detection-using-smote-adasyn параграф называется Class Imbalance

kraidiky
26.03.2021 18:57
#22852538
+2
почему его алгоритмы не могут быть такими же необъективными и проявлять такую же несправедливость?

Сейчас на глазах у изумлённой публики автор этого наброса сумеет дать не зависящее от культурных и политических взглядов определение справедливости и сразу же войдёт в историю. :)))

iliasm
26.03.2021 18:59
#22852540
машинное обучение — обучение на данных, разве нет? данные дискриминирующие, выходит.
получается тогда и данные дискриминирующие.
белых больше в выборке? напомню что пока в США белых таки больше в массе.
твиты более оскорбительны? ну да, кому-то можно сказать "ниггер", а кому-то только "n-word" (пока) можно, если обучать на выборке где считать это слово адски уничижительным и грубым, то получится что вокруг него будут определённые обороты, которые свойственны чернокожим, соответственно модель обучится. но вообще поиск такой штуки как "оскорбительный" само по себе смешное занятие

давайте не будем доводить до того что коммитеты добра будут нам утверждать ML модельки, ладно?

kogemrka
26.03.2021 19:11
#22852574
+2
твиты, написанные афроамериканцами, в среднем отмечены алгоритмами ИИ как оскорбительные (хотя на самом деле таковыми не являются, показатель false positive) в 1,5 раза чаще, чем такие же твиты белых.

COMPAS, система искусственного интеллекта, используемая для прогнозирования вероятности совершения преступником другого преступления, оказалась явно настроенной против афроамериканцев. Получилось так, что у афроамериканцев было вдвое больше ложных предсказаний рецидивизма, чем у белых американцев.

Исследование Тимнит Гебру и Джой Буоламвини показало

Зачем вы подчернули и выделили жирным какие-то утверждения не приведя ссылок непосредственно на исследования? Вы в интернете пишете, ссылки вставлять здесь легко и приятно.

Впрочем, писали бы вы на бумаге, к таким утверждениям всё равно требовалось бы ставить сноски.

uhf
26.03.2021 20:02
#22852728
Следовательно, этот алгоритм был не эффективен при обнаружении рака кожи у людей с более тёмными тонами кожи

Алгоритм эффективен, неэффективна конкретная обученная модель. Но кто сказал, что она вообще должна быть одинаково эффективной для белых и чернокожих? С чего вдруг?
Существуют товары, предназначенные только для чернокожих, ввиду их физиологических особенностей — например, косметика, шампуни. И никого это не удивляет. Обучайте специальные модели только для чернокожих, хоть рак распознавать, хоть твиты. Я думаю, никто не будет против.

PleaseKING
27.03.2021 07:50
#22853906
На самом деле, проблема data bias действительно существует, просто ее надо иллюстрировать не на политических, а на технических примерах. Вот, например, очень неплохая статья на эту тему.

А привнесение политического аспекта немедленно убивает дискуссию и здравый смысл.

Nehc
27.03.2021 11:08
#22854208
Самое интересное, что вот такие вот статьи, которые с натяжкой еще можно отнести к относительно технически-грамотным в обычных СМИ трансформируются в «Нейронные сети отражают заблуждения их разработчиков», и далее делается вывод, что если программист «не толерантен к цветным», то он дескать и нейросеть научит! От несбалансированности данных незаметно переходим на разработчиков-расистов…

Matshishkapeu
27.03.2021 17:38
#22855244
Тащемта не совсем понятен бомбит у читателей. Возможно, от незнания реалий светлого мира, где написанные на коленке классификаторы, обученные на исторических данных когда у негров ещё были отдельные туалеты — эти классификаторы используются при принятии судебных решений (оценка риска рецедива). Статья, конечно, не особо впечатляет, интересующимся могу посоветовать книгу 'Weapons of math destruction' by Cathy O'Neil. Там и примеров много, и написана человеком понимающим в данных с примерами и так далее. Есть в русском переводе ( 'Убийственнын большие данные') и находится на пиратских сайтах.
1. logran
  28.03.2021 10:54
  #22856560
  А что тут понимать то, если в статье проблемы не в нейронках, а в предвзятом взгляде автора?
  Тезис: модель не распознает рак у черных => алгоритм не эффективен.
  В реальности: скорее всего авторы учили его на данных, полученных от какой-то больницы. И на пациентах этой больницы алгоритм показывает необходимую эффективность => с ним всё в порядке. Хотите ту же эффективность на весь мир — подсуньте алгоритму на обучение данные со всего мира, но сам алгоритм менять не надо, проблема не в нём, а в людях.
  
  Тезис: нейронка считает твиты черных ложно оскорбительными => нейронка кривая и расист.
  В реальности: баг прошивки мозга некоторых людей, приводящий к ситуации, когда одно и то же высказывание является и оскорбительным и нет, в зависимости от цвета кожи говорящего. Учитывая, что смысл высказывания от этого не меняется — это дибилизм, имхо, и чинить тут надо людей, а не нейронку и данные.
  Нейронке на вход подали инфу, что в условных 95% случаев нигер — оскорбление, она его везде таковым и пометит. Ибо это анализирующая текст нейронка, а не анализирующая цвет кожи. Ей вообще пофигу кто автор поста — она об этом ничего не знает и знать не должна. Так что чините людей, неприемлющих объективные данные в силу багов восприятия, а не рабочий алгоритм.
  
  И дальше по тексту примеры в том же духе.
  
  Да, хватает ситуаций с проблемными обучающими выборками и с косячными моделями. Вот только это точно не про описанное в посте.

egretos
01.04.2021 17:20
#22873618
Круто было бы дополнить статью материалами, где ИИ использует равномерное разнообразие разных групп. Ведь исходя из статьи — дискриминация уже есть на уровне входных данных (от человека). Будет ли такая же дискриминация, если скормить ИИ равномерно разнообразные данные?

Ka_Wabanga
01.04.2021 17:20
#22873620
Это не проблема в ML, а проблема в данных — модели только инструмент.

Очень часто вспоминаю фразу — «Говно на входе — говно на выходе».

А сбор данных, валидация, чистка это отдельный огромный мир.