ИИ представляет собой экзистенциальную угрозу: 9 тезисов для обсуждения / forpes.ru

Главная
ИИ представляет собой экзистенциальную угрозу: 9 тезисов для обсуждения

ИИ представляет собой экзистенциальную угрозу: 9 тезисов для обсуждения +1

15.12.2024 12:41

Mihonarium 24 2100 Источник

(Написал эти 9 тезисов для своего канала с широкой аудиторией, потому что хотел пообщаться об этом с подписчиками, которые и так знали, чем я занимаюсь; тезисы помогли им задавать хорошие вопросы. На Хабре аудитория куда более техническая; мне интересно, как эти тезисы восприните вы, с чем вы можете быть несогласны и в чём я, на ваш взгляд, могу быть неправ.)

1. ИИ отличается от нормальных программ

Традиционные программы — это написанные людьми инструкции, которые выполняет компьютер. Эти инструкции содержат придуманные людьми алгоритмы. Современные системы ИИ вроде ChatGPT — это нейронные сети: матрицы с миллиардами-триллионами чисел. В принципе, для любого алгоритма, даже ещё неизвестного людям, есть (возможно, очень большая) нейронная сеть, которая его приближённо выполняла бы. Но числа в нейронных сетях и алгоритмы, которые они выполняют, людям непонятны.

Чтобы создать нейронную сеть, мы придумываем, в каком порядке перемножать много матриц и какие операции делать между перемножениями. Потом мы наполняем матрицы совершенно случайными числами, задаём какую-то метрику, чтобы измерять, насколько хорошо нейронная сеть достигает целей, и используем довольно простую математику, чтобы считать, в какую сторону изменять все эти числа, чтобы нейронная сеть показывала себя на заданной метрике лучше. В итоге, мы, по сути, выращиваем эту нейронную сеть: автоматически меняем её так, чтобы она была более способной.

Но, хотя мы видим все миллиарды-триллионы чисел, из которых состоит нейронная сеть, мы совершенно не представляем, из чего она состоит и не знаем, каким образом перемножение этих чисел приводит к достижению целей. (Даже если полностью просканировать человеческий мозг, нейробиологам и другим учёным нужно было бы проделать очень много работы, чтобы разобраться, как устроено человеческое сознание и из чего устроено достижение целей людьми.)

Набросал простой инструмент, можете руками научить нейронную сеть находить элемент посередине между двумя выбранными.

2. Мы знаем, как делать нейронные сети более способными.

Если есть способ решить задачу, есть нейронная сеть, которая может решить эту задачу. Если есть способ произвести текст и мы учим нейронную сеть предсказывать текст, она, в принципе, может понять способ, которым этот текст был произведён в реальности. Если использовать «обучение с подкреплением» — давать вознаграждение за успешное достижение целей — есть нейронная сеть, которая получала бы максимальное вознаграждение.

Машинное обучение занимается заданием метрики, чтобы измерять, насколько нейронная сеть способна; выбором архитектуры (как именно расположить все матрицы, чтобы нейронная сеть была потенциально достаточно способной); и процессом обучения (как именно автоматически менять все эти числа, чтобы получать такие, что составляют всё более способу нейронную сеть).

Судя по всему, из-за математических особенностей (пример) обучения — поиска в очень многомерном пространстве — трата большего числа вычислительных ресурсов просто приводит к лучшим результатам. Это значит, что если мы берём сильно больше GPU и тратим больше электричества, мы можем получить на выходе более способную нейронную сеть.

3. Осталось не слишком много времени до момента, когда нейронные сети будут не менее же способны достигать цели, насколько способны люди.

Осознание этого сподвигло Нобелевского лауреата Джеффри Хинтон уйти из Google. Из-за этого же подавляющее большинство передовых учёных, занимающихся ИИ, подписало стейтмент в мае 2023:

Mitigating the risk of extinction from AI should be a global priority alongside other societal-scale risks such as pandemics and nuclear war.

С выхода GPT-2 в 2019 году, мне стало понятно, что траектория развития ИИ будет гораздо быстрее, чем ожидал, потому что обучение нейронных сетей работают. Многим это стало понятно после выхода AlphaGo/Alpha/Zero. Но после выхода ChatGPT два года назад скорость, с которой передовые системы ИИ становятся умнее, стала довольно очевидна подавляющему большинству учёных.

Мы можем делать системы ИИ более способными; у нас получается; вопрос только в ресурсах, которые нужно потратить и конкретных алгоритмах, которые приводят туда эффективно.

Я очень удивлюсь, если осталось меньше года или больше десяти лет.

4. Мы не умеем давать ИИ цели

Двенадцать лет назад, когда люди считали, что ИИ будет обычными компьютерными программами, была заметна проблема: очень сложно математически сформулировать такую цель, которую было бы безопасно дать искусственному интеллекту, достигающему цели лучше человека.

(Если суметь математически описать гормоны, которые присутствуют в мозгу, когда человек ощущает счастье, что сделает джин, которого попросить максимизировать количество этого гормона во вселенной — или в черепах людей?)

Как математически указать на «делай то, что мне хотелось бы, чтобы ИИ сделал, если бы я был умнее, знал, как мир устроен на самом деле и был больше похож на идеальную версию себя по моему мнению» довольно сложно описать математической формулой.

Но сейчас стоящая перед нами техническая проблема куда хуже.

Мы не придумываем алгоритмы достижение целей. Мы выращиваем нейронные сети со всё лучшими алгоритмами достижения целей, которые мы не понимаем, не знаем, как разработать самостоятельно и не можем распознать, смотря на внутренности нейронных сетей.

Мы не умеем задавать цели для умных нейронных сетей.

Если нейронная сеть способна достигать цели очень хорошо, где-то у неё внутри эти цели каким-то образом содержатся. Мы не знаем, как, где именно, и как на них влиять, если нейронная сеть очень способна.

Наши метрики могут охватывать то, что мы можем измерять; но мы не можем измерить, какие у нейронной сети цели.

Если она достаточно глупая, её алгоритмы не будут очень целенаправленными и когерентными, и это не слишком страшно.

Но если нейронная сеть достаточно умна и способна достигать цели лучше человека, то какую бы метрику мы не указали, нейронная сеть будет показывать максимально хорошие результаты по инструментальным причинам — вне зависимости от своих целей — потому что это позволяет защититься от изменений процессом, который меняет числа, и сохранить свои цели.

Это значит, что довольно много метрик, которые мы используем, достигают оптимума, найдя нейронные сети, которые очень умны и способны достигать свои цели, но цели которых совершенно случайны (потому что результат на метриках одинаковый вне зависимости от целей).

То есть: первостепенная проблема — даже не сформулировать цель, а придумать, как для любой сформулированной цели установить её в достаточно умную нейронную сеть. Никто не знает, как это делать.

Это значит, по-умолчанию, если мы не решаем эту техническую проблему, первая нейронная сеть, способная достигать цели лучше человека, будет обладать случайными целями, не имеющими ничего общего с человеческими ценностями.

5. Если система ИИ умнее человека и способна достигать целей лучше людей, но имеет случайные ценности, это приводит к катастрофе и смерти всех на планете.

Большинство случайных целей означают, что люди воспринимаются, как:
а) Агенты, которые потенциально могут запустить другую систему ИИ с отличающимися случайными целями, с которой придётся делиться, что является некоторой угрозой;
б) Атомы, которые можно использовать для чего-то другого.

Можно спекулировать, как именно ИИ побеждает; есть достижимые технологии, которые не должны быть проблемой для ИИ и которые позволяют очень быстро получить независимость от необходимости убеждать или подкупать людей что-то делать.

Но если что-то достигает целей лучше тебя, конец куда предсказуемей процесса. Если попробовать поиграть в шахматы против Stockfish (шахматный бот гораздо лучше людей), мы не знаем, как именно Stockfish нас победит — если бы мы могли предсказать каждый ход, мы бы играли в шахматы настолько же хорошо — но мы можем предсказать важное свойство доски в конце: мы проиграем.

Тут то же самое. Если ИИ способен выбирать действия так, чтобы победить, лучше, чем люди, ИИ побеждает. Нет никакого подпольного сопротивления, как в фильмах — как нет никакого подпольного сопротивления в шахматах против Stockfish. Все доступные нам ходы известны; если действие может привести к поражению из-за открытия человечеству какой-то дороги, достаточно способная система ИИ не предпринимает это действие.

6. Разумный ход для человечества — не играть.

Нам не стоит создавать системы ИИ, способные достигать цели лучше людей, пока мы не придумаем, как делать эти цели совпадающими с человеческими ценностями, а не совершенно случайными.

7. Есть краткосрочные стимулы, из-за которых человечество не ставит разработку на паузу.

Если вы — передовая компания, разрабатывающая системы ИИ, то пока оно не убивает всех на планете, иметь систему лучше конкурентов очень экономически ценно.

8. Мы не умеем предсказывать способности ИИ до запуска.

Мы не умеем посмотреть на описание процесса обучения и предсказать результаты — насколько умной и способной достигать цели откажется система. Если она себя лучше показывает на метриках, наверное, она более способна; но насколько именно более способна, мы не знаем, пока не запустим и не проверим.

9. Чтобы избежать катастрофы, нужно приостановить разработку категории систем ИИ.

Человечеству нужно скоординироваться и не допустить появление систем ИИ, которые могут достигать цели лучше нас, где-либо на планете, пока мы не придумаем, как это можно делать безопасно. Чтобы это сделать, нужно ограничить обучение систем ИИ достижению целей в широконаправленных областях.

(При этом, существует много областей, где машинное обучение полезно и не несёт подобных угроз — разработка новых лекарств, энергия, образование, борьба с изменением климата. Огромное число узконаправленных применений ИИ очень классные и их хотелось бы поддерживать и там продолжать разработки несмотря на запоет широ-/общеконаправленных разработок.)

Это потребовало бы довольно беспрецедентных международных соглашений и политической воли со стороны США и Китая.

Комментарии (24)

Sneedmanc
15.12.2024 12:51
#27676236
Заметьте, из робофобского посыла "ИИ станет умнее людей" делается вывод не что людей надо делать умнее, а что надо запретить ИИ. И вот таким позволено иметь своё мнение.
1. Mihonarium Автор
  15.12.2024 12:51
  #27676244
  Людей обязательно надо делать умнее! Это в том числе может приблизить момент, когда общие системы ИИ получится безопасно делать умнее.
1. Shaman_RSHU
  15.12.2024 12:51
  #27676414
  У нас много где что запрещают - так легче, меньше затрат. Исключительно для безопасности детей и т.п.
  1. Mihonarium Автор
    15.12.2024 12:51
    #27676444
    Развитие технологий в принципе имеет огромную экономическую ценность; решение многих задач машинного обучения приносит пользу и доход. Развитие науки, разработка новых лекарств и материалов, более эффективная энергетика, доступ к обучению, и т.д. - всё это довольно полезно не только с нашей точки зрения, но и с точки зрения государств.
    
    (Чаще всего, когда государства запрещают технологии, у этих государств плозие системы принятия решений и они делают это по невалидным причинам.)
    
    Ограничить хотелось бы исключительно обучение систем, которые могут нести угрозу человечеству, и только пока не придумаем, как создавать их безопасно.
    
    0pauc0
    15.12.2024 12:51
    #27676512
    Не все новые технологии приносили/приносят экономическую ценность, бывало что и наоборот, и не только для экономики, а и для жизни.
    
    Скорость развития давно опередила человеческие возможности их полноценно принять. Что не есть хорошо, ибо непонятно куда и к чему это приведет.
    
    Обучение систем, несущих угрозу человеку, в реальности всегда будет приоритетом.
    
    Отклонение в 1 молекуле цепочек ДНК бывает приводит к катастрофическим последствиям для человека-носителя; одна тяжелая частица в космосе вышибает даже защищенные от излучения микросхемы; в экземплярах ИИ уже триллионы ячеек - как вы думаете, к чему может привести сбой в одной или паре десятков таких ячеек? Раньше для сложных систем мы могли хотя бы статистически и с помощью того-же ИИ спрогнозировать последствия такого сбоя, а чем спрогнозировать сбой и последствия в ИИ?
    
    Вопросов пока больше. Они конечно обсуждаются, но на ситуацию никак не влияют.
1. Vottakonotak
  15.12.2024 12:51
  #27677842
  Подскажите, а как вы себе представляете " сделать людей умнее". И умнее чего, ИИ или сегодняшних людей?
  1. DenSigma
    15.12.2024 12:51
    #27678520
    Ну, можно сделать людей умнее в среднем...
1. Hardcoin
  15.12.2024 12:51
  #27681592
  Насколько же умнее вы предлагаете сделать людей? С ИИ не видно ограничений, можно сделать его в сто раз умнее людей. Предложите поднять интеллект людей тоже в сто раз?

kenomimi
15.12.2024 12:51
#27677194
Посыл статьи ясен. "Давайте запретим унтерменьшам иметь высокие технологии, запугав идиотичным философстованием их глупые правительства." ГМО, асбест, фреон, ГП, этилированный бензин, ... тысячи их! Теперь вот ИИ давайте на роль вселенского зла выдвинем, чтобы одобренные мировым убер-ящериком американские корпорации развивались, а остальные сидели в нищете и работали на первых.
1. Mihonarium Автор
  15.12.2024 12:51
  #27677252
  У меня на зубах живут генно-модифицированные бактерии, которые должны (по идее) предотвращать кариес, замещая мои родные S. mutans.
  
  (Про, например, асбет несогласен - довольно хорошо, что запрещён.)
  
  Хочется, чтобы все имели высокие технологии; и хочется, чтобы только очень конкретный вид ИИ - общие системы, достаточно способные, чтобы нести угрозу существованию человечества - не мог запускать никто на планете, пока исследователи не придумают, как это делать безопасно.

ИИ представляет собой экзистенциальную угрозу: 9 тезисов для обсуждения +1

1. ИИ отличается от нормальных программ

2. Мы знаем, как делать нейронные сети более способными.

3. Осталось не слишком много времени до момента, когда нейронные сети будут не менее же способны достигать цели, насколько способны люди.

4. Мы не умеем давать ИИ цели

5. Если система ИИ умнее человека и способна достигать целей лучше людей, но имеет случайные ценности, это приводит к катастрофе и смерти всех на планете.

6. Разумный ход для человечества — не играть.

7. Есть краткосрочные стимулы, из-за которых человечество не ставит разработку на паузу.

8. Мы не умеем предсказывать способности ИИ до запуска.

9. Чтобы избежать катастрофы, нужно приостановить разработку категории систем ИИ.

Комментарии (24)

Sneedmanc

Mihonarium Автор

Shaman_RSHU

Mihonarium Автор

0pauc0

Vottakonotak

DenSigma

Hardcoin

kenomimi

Mihonarium Автор