Фото: news.mit.edu
Исследователи Массачусетского технологического университета разработали систему искусственного интеллекта, которая способна переписывать устаревшие предложения в статьях «Википедии». При этом, как утверждают разработчики, система сохраняет тон человека-редактора.
Например, в этом предложении есть обязательное обновление (выделено жирным): «Фонд А считает, что 28 из 42 их миноритарных пакетов акций в действующих компаниях имеют особое значение для группы». Обновленное предложение может гласить: «Фонд А считает 23 из 43 миноритарных пакетов акций существенными». Система сможет разместить соответствующий текст в интернет-энциклопедии, автоматически удалив устаревшие числа (28 и 42) и заменяет их новыми числами (23 и 43), но сохраняя при этом предложение точно таким же грамматически корректным.
Авторы разработки пояснили, что люди не всегда оперативно редактируют статьи интернет-энциклопедии, а специальные боты отслеживают лишь нарушения правил и работают по шаблонам. Расширение статей, серьезные переписывания или другие рутинные изменения, такие как обновление номеров, дат, имен и местоположений в настоящее время добровольно выполняются пользователями из разных стран.
Систему, основанную на машинном обучении, научили распознавать различия между предложением из статьи и предложением с обновленными фактами. Если она видит какие-либо противоречия между этими двумя высказываниями, то использует «маску нейтральности», чтобы определить те противоречивые слова, которые нужно удалить, и те, которые обязательно нужно сохранить. После этого структура кодера-декодера определяет, как переписать предложение.
Идея состоит в том, что люди-редакторы будут вводить в систему неструктурированное предложение с обновленной информацией, не беспокоясь о стиле или грамматике. Затем система будет находить в «Википедии» соответствующую страницу и устаревшее предложение и переписывать его по-человечески. В будущем, по словам исследователей, существует потенциал для создания полностью автоматизированной системы, которая идентифицирует и использует самую последнюю информацию из Интернета для внесения правок в статьи.
Отмечается, что систему также можно использовать для дополнения наборов данных, предназначенных для обучения детекторов фейкньюс, что потенциально снижает предвзятость и повышает точность информации.
Исследователи намерены усовершенствовать систему ИИ, которая могла бы использоваться для внесения незначительных правок в «Википедии», а также в редактировании новостных материалов или других документов, когда не требуется редактор-человек.
Исследователи Массачусетского технологического университета разработали систему искусственного интеллекта, которая способна переписывать устаревшие предложения в статьях «Википедии». При этом, как утверждают разработчики, система сохраняет тон человека-редактора.
Например, в этом предложении есть обязательное обновление (выделено жирным): «Фонд А считает, что 28 из 42 их миноритарных пакетов акций в действующих компаниях имеют особое значение для группы». Обновленное предложение может гласить: «Фонд А считает 23 из 43 миноритарных пакетов акций существенными». Система сможет разместить соответствующий текст в интернет-энциклопедии, автоматически удалив устаревшие числа (28 и 42) и заменяет их новыми числами (23 и 43), но сохраняя при этом предложение точно таким же грамматически корректным.
Авторы разработки пояснили, что люди не всегда оперативно редактируют статьи интернет-энциклопедии, а специальные боты отслеживают лишь нарушения правил и работают по шаблонам. Расширение статей, серьезные переписывания или другие рутинные изменения, такие как обновление номеров, дат, имен и местоположений в настоящее время добровольно выполняются пользователями из разных стран.
Систему, основанную на машинном обучении, научили распознавать различия между предложением из статьи и предложением с обновленными фактами. Если она видит какие-либо противоречия между этими двумя высказываниями, то использует «маску нейтральности», чтобы определить те противоречивые слова, которые нужно удалить, и те, которые обязательно нужно сохранить. После этого структура кодера-декодера определяет, как переписать предложение.
Идея состоит в том, что люди-редакторы будут вводить в систему неструктурированное предложение с обновленной информацией, не беспокоясь о стиле или грамматике. Затем система будет находить в «Википедии» соответствующую страницу и устаревшее предложение и переписывать его по-человечески. В будущем, по словам исследователей, существует потенциал для создания полностью автоматизированной системы, которая идентифицирует и использует самую последнюю информацию из Интернета для внесения правок в статьи.
Отмечается, что систему также можно использовать для дополнения наборов данных, предназначенных для обучения детекторов фейкньюс, что потенциально снижает предвзятость и повышает точность информации.
См. также: «В Alphabet разработали инструмент для борьбы с фейковыми фотоОднако пока технология готова не до конца. Люди, оценивающие точность ИИ, дали системе средние оценки 4 из 5 за фактические обновления и 3.85 из 5 за грамматику. Это лучше результатов других систем для генерации текста, но заметить разницу с человеком еще можно.
Исследователи намерены усовершенствовать систему ИИ, которая могла бы использоваться для внесения незначительных правок в «Википедии», а также в редактировании новостных материалов или других документов, когда не требуется редактор-человек.
См. также:
demon416nds
Как говорится добро пожаловать в эпоху постправды.
NeoCode
А при чем тут «эпоха постправды»?
demon416nds
тут нужно целый пост пилить
но если кратко то при стадном инстинкте, вере в авторитеты и неверифицируемости сгенерированного контента (ибо ии в состоянии состряпать любое количество «первоисточников»)