Аутофагия в моделях генеративного ИИ может стать проблемой в скором будущем / forpes.ru

Главная
Аутофагия в моделях генеративного ИИ может стать проблемой в скором будущем

Аутофагия в моделях генеративного ИИ может стать проблемой в скором будущем

23.08.2024 13:50

technokratiya 6 9700 Источник

Чтобы генеративные модели искусственного интеллекта могли создавать новые формы контента, их нужно регулярно обучать на новых данных, которые создает человечество. Но что будет, если контент, созданный человеком, закончится? Тогда модели вынуждены будут обучаться на ранее сгенерированном ИИ-контенте, что может привести к «ИИ-аутофагии». И это явление может стать реальной проблемой для развития LLM.

Новое исследование, проведенное учеными из Университета Райса и Стэнфордского университета в США, говорит о том, что, когда системы искусственного интеллекта обучаются на синтетическом, машинном материале, а не на текстах и изображениях, созданных реальными людьми, качество их работы начинает страдать.

Лица, созданные на основе данных искусственного интеллекта, постепенно приобретают артефакты

Исследователи назвали этот эффект модельным расстройством аутофагии (Model Autophagy Disorder, MAD). ИИ фактически потребляет сам себя, что можно сравнить с коровьим бешенством - неврологическим расстройством у коров, которых кормят инфицированными останками другого скота.

Без свежих, реальных данных контент, создаваемый ИИ, снижается по уровню качества, разнообразию или по обоим показателям, говорится в исследовании. Это предупреждение о том, что в будущем ИИ будет работать с отходами от этих моделей.

«Наши теоретические и эмпирические исследования позволили нам экстраполировать то, что может произойти, когда генеративные модели станут повсеместными, и обучать будущие модели в самообучающихся циклах», - говорит инженер Ричард Баранюк из Университета Райса.

«Некоторые последствия очевидны: без достаточного количества свежих реальных данных будущие генеративные модели обречены на провал».

Баранюк и его коллеги работали с визуальной генеративной моделью, обучая ее на трех разных типах данных: полностью синтетических, синтетических, смешанных с реальными данными, которые были зафиксированы, и синтетических, смешанных с реальными данными, которые постоянно обновлялись.

По мере повторения циклов в первых двух сценариях вывод модели становился все более искаженным. Это проявлялось в виде более заметных артефактов - шрамов, похожих на сетку, на сгенерированных компьютером лицах.

Более того, лица становились все более похожими друг на друга, когда не использовались свежие, сгенерированные человеком обучающие данные. В тестах с использованием рукописных цифр цифры постепенно становились неразборчивыми.

Если использовались реальные данные, но в фиксированном виде, без добавления новых, качество результатов все равно снижалось, просто на это требовалось немного больше времени. Выходит, что актуальность имеет решающее значение.

«Наша группа много работала над такими циклами обратной связи, и плохая новость заключается в том, что даже после нескольких поколений такого обучения новые модели могут быть непоправимо испорчены», - говорит Баранюк.

Хотя в данном конкретном исследовании речь шла о генерации изображений, команда утверждает, что большие языковые модели (LLM), предназначенные для создания текста, будут работать точно так же. Это действительно было замечено в других исследованиях.

Эксперты уже предупреждали, что у инструментов генеративного ИИ заканчивается запас данных для обучения, и это последнее исследование стало еще одной попыткой сдержать шумиху вокруг ИИ. Это, безусловно, многообещающая технология, но и у нее есть свои ограничения.

«Один из сценариев развития событий заключается в том, что если оставить MAD без контроля на протяжении многих поколений, то он может отравить качество и разнообразие данных во всем интернете», - говорит Баранюк.

Исследование было представлено на International Conference on Learning Representations (ICLR), и вы можете прочитать сопроводительную статью.

Комментарии (6)

AspisVipera
23.08.2024 15:34
#27200456
+7
Исследователи назвали этот эффект модельным расстройством аутофагии (Model Autophagy Disorder, MAD). ИИ фактически потребляет сам себя, что можно сравнить с коровьим бешенством - неврологическим расстройством у коров, которых кормят инфицированными останками другого скота.

Данная статья вероятно тоже является порождением аутофагии.
1. Anti-antivakser
  23.08.2024 15:34
  #27205656
  Да потому что коров НЕ кормят никакими останками никаких животных
  1. vadimevtushenko
    23.08.2024 15:34
    #27206922
    +1
    Гуглим "Мясокостная мука" и "эпидемия коровьего бешенства в Великобритании"

marenkov
23.08.2024 15:34
#27207162
Через некоторое время люди почти перестанут создавать контент, и это мы будем учиться от ИИ.

waks32
23.08.2024 15:34
#27208188
Напоминает генетические поломки при близкородственных связях у людей.

bigbamblbee
23.08.2024 15:34
#27208210
Какая то выдуманная проблема, которая звучит из каждого радиоприемника. Существующий объем данных сейчас просто огромен. Он колоссален, я бы сказал. И сложность скорее всего в подготовке этих данных и компетенциях инженеров по обучению модели.

Аутофагия в моделях генеративного ИИ может стать проблемой в скором будущем

Комментарии (6)

AspisVipera

Anti-antivakser

vadimevtushenko

marenkov

waks32

bigbamblbee