В связи с развитием информационных технологий и интернета, появились новые способы публикации, обмена и потребления новостей и информации. Из-за огромного потока информации в медиа сфере стандарты контроля и редакционные нормы значительно снизились. В интернет-пространстве стало появляться всё больше недостоверной информации.
Fake news — это новости, которые не соответствуют действительности, придуманные для отвлечения внимания аудитории.
Актуальность данной тематики обусловлена огромным количеством недостоверной информации, распространяющейся в интернете на сегодняшний день. Например, статистика, представленная на рисунке 1 [1], демонстрирует распространение фейковых новостей о коронавирусе лишь за четыре дня.
Люди часто обращаются к информации, опубликованной на различных ресурсах, чтобы на её основе принять важные решения, следовательно, достоверность новостей имеет огромную важность. Прочтение недостоверной информации может повлечь за собой последствия в виде опасности.
Последствия фейковых новостей
отсутствие возможности различия недостоверных и достоверных новостей. Таким образом происходит общественный подрыв доверия к достоверным источникам;
введение в заблуждение при прочтении текста в контексте определенной сферы деятельности. Например, люди могут принять неверные решения в отношении лечения или, наоборот, отказ от лечения, что может пагубно повлиять на здоровье;
использование дезинформации в деятельности. Например, люди, обучающиеся в образовательных учреждениях должны использовать проверенные источники для выполнения каких-либо заданий, иначе это повлечёт распространение дезинформирующего контента.
Распространение дезинформирующего контента в своём большинстве публикуется на интернет-ресурсах, а также в социальных сетях. Платформы социальных сетей начали сокращать количество недостоверного контента, но полностью устранить его практически невозможно. Для понимания концепции фейковых новостей, нужно иметь представление об этапах создания дезинформирующей информации.
Алгоритм построения фейковой новости
1. Постановка цели
Для четкой постановки цели создатель дезинформирующего контента должен иметь представление о предметной области, в которой будет создавать недостоверную новость, представлять аудиторию данной области. Например, может быть проведён анализ конкретной выборки людей, которые интересуются той или иной сферой деятельности.
2. Создание
Для создания вида достоверной информации формируется правдоподобный антураж. Люди события, место и время действий – реальные, а само событие является фейковым.
3. Распространение
Чаще всего распространение фейковой новости происходит посредством появления на различных сайтах, которые имеют низкие уровни достоверности информации и контроля её публикации. Также к делу может быть привлечён влиятельный человек с некой аудиторией, среди которых есть как боты, просто распространяющие информацию, так и обычные люди.
4. Использование
Новость доходит до целевой аудитории, которая неумышленно распространяет недостоверную информацию, вследствие чего привлекает внимание со стороны СМИ и других крупных источников.
5. Изменение мышления
Данный способ используется для долговременных кампаний продвижения фейковой новости. Она начинает раскрываться с разных аспектов, некоторые источники начинают дополнять дезинформирующую новость, пытаясь привлечь внимание к своей статье.
6. Корректировка
Для того, чтобы фейковая новость не выглядела слишком подозрительно, организаторы кампании по дезинформации выпускают нейтральную новость, посредством которой корректируется образ какого-либо события или человека в глазах общественности.
7. Сокрытие
Для сокрытия факта недостоверности новости, используют простой приём: создаётся ещё одна новость с более громким названием и совершенно другим содержанием, затем с помощь команды ботов распространяется в интернет-пространстве. Данный способ требуется для того, чтобы первую новость приняли как факт и стали изучать более актуальную новость.
Исходя из алгоритма создания дезинформирующего контента можно составить алгоритм, позволяющий распознать недостоверную новость.
Алгоритм распознавания фейковой новости
1. Проверка первоисточника
Важно установить первоисточник. Надо найти самое первое упоминание статьи, стоит уделить внимание дате публикации. Оценка уровня доверия к источнику можно установить по правильному оформлению: статья не содержит орфографических ошибок, редкие или неизвестные домены, установлена дата публикации новости, указан автор. Если сайт содержит вышеперечисленные пункты, но вызывает недоверие, стоит изучить раздел «О компании».
2. Оценка автора
Необходимо уделить внимание автору данной публикации. Стоит проверить реальный ли это человек, его репутацию, компетентность в данном вопросе. В большинстве случаев у недостоверных новостей не бывает автора публикации или же фейковые новости могут использовать имена неизвестных журналистов.
3. Проверка других источников
Также один из важных аспектов – проверка наличия данной новости на более крупных и проверенных сайтах, которые всегда проверяют публикуемую информацию на своих ресурсах. Для отвлечения внимания добавляют ссылки на используемые источники, но используют источники, которые никоим образом не относятся к новости.
4. Критическое мышление
Один из самых заметных аспектов в фейковой новости – это гиперболизированный заголовок. Основная цель заголовка – коротко передать суть статьи. Если название не несёт никакого смысла, а лишь создаёт вопросы, то новость стоит проигнорировать.
5. Проверка фактов
Достоверные новости содержат много фактов, например, статистику, цитаты экспертов и подобное. Если статья ссылается на статистику без указания источника, откуда и кем она была проведена, то данная информация создана для заблуждения читателей.
6. Оценка комментариев
Если новость имеет комментарии, то это не подтверждает достоверность информации. Под фейковыми новостями очень часто оставляют комментарии боты, чаще всего содержание данных комментариев не имеет отношение к статье или же просто является набором символом, так как генерируются автоматически.
Есть ли выход?
Современные проблемы требуют современных решений, и использовать данные алгоритмы можно автоматически с помощью обученной нейронной сети.
На основе алгоритмов распознавания и создания фейковых новостей, была разработана "Разведка операций влияния" (РИО). Эта система автоматически обнаруживает дезинформацию в интернет-пространстве и аккаунты, распространяющие данные материалы. Система РИО содержит в себе аналитические методы, которые разрабатывались посредством сбора данных в интернете и их анализе. Используя данную систему, команда разработчиков смогла обнаружить аккаунты, распространяющие недостоверную информацию, с точностью до 96%.
В будущем, данная система будет эксплуатироваться правительством, промышленностью и во всех других сферах, где нужно проверять достоверность информации, вплоть до традиционных видов СМИ, например, как газета.
Список используемой литературы
1. Статистика распространение фейковых новостей о коронавирусе: [Электронный ресурс] // Group-IB. URL: https://www.group-ib.ru/media/fake-news-coronavirus/ (Дата обращения: 11.11.2021)
2. Алгоритм построения фейковой новости: [Электронный ресурс] // Habr, 2006-2021. URL: https://habr.com/ru/company/trendmicro/blog/478040/ (Дата обращения: 11.11.2021)
3. Алгоритм распознавания фейковой новости: [Электронный ресурс] // Kaspersky, 1997-2021. URL: https://www.kaspersky.ru/resource-center/preemptive-safety/how-to-identify-fake-news (Дата обращения: 11.11.2021)
4. "Разведка операций влияния" (РИО): [Электронный ресурс] // MIT. URL: https://news.mit.edu/2021/artificial-intelligence-system-could-help-counter-spread-disinformation-0527 (Дата обращения: 11.11.2021)
Комментарии (9)
addewyd
08.10.2022 13:35+2Примеры можно? У меня смутное подозрение, что если система действительно работает (96), то авторы могут и присесть.
sovaz1997
08.10.2022 15:10+3с точностью до 96%
Вопрос - как можно в условиях недостаточной информации сделать прогноз с такой точностью? Ответ - никак. Вам никто не покажет полную картину мира. Соответственно вы будете в любом случае дезинформированы, какие бы источники не считали правдивыми.
Moskus
08.10.2022 19:30+5Важно установить первоисточник
В общем случае - нет, не важно. Потому что правдивость изложенного определяется смыслом, а не происхождением.
Необходимо уделить внимание автору данной публикации.
Нет, не необходимо (см. выше), плюс, это апелляция к авторитету или обратная ее форма - апелляция к тому, что автор - "никто".
Проверка других источников
Может помочь в единственном случае - если можно достоверно установить, что информация о рассматриваемом факте получена другими источниками независимо друг от друга. Потому что журналисты, например, имеют гнусную привычку перепечатывать одно и то же друг за другом, выдавая за результат оригинального расследования.
Также, в этом часто есть элемент апелляции к авторитету, подразумевающей, что "серьезное уважаемое издание" никогда не позволит себе перепечатать бред. Позволит, еще как. А потом будет еще судиться, настаивая на том, что это было "мнение", а не фактическая ложь.
Один из самых заметных аспектов в фейковой новости – это гиперболизированный заголовок.
К большому сожалению, сейчас даже строго научные новости постоянно подаются с кликбейтным заголовком (и это плохо) потому что аудитория привыкла к этому и не обращает внимания на "скучные" заголовки. Впрочем, это - косвенный признак в любом случае.
Проверка фактов
Вот только тут подошли к сути, потому что это - единственное, что позволяет достоверно оценить то или иное высказывание.
Оценка комментариев
Пишут, что комментарии не играют роли, тогда как там вполне может содержаться дополнительная информация, которую можно использовать для проверки (сужения области поиска, например).
В общем, статья - смесь карго-культа (бездумные, недействующие методы), поддельного героизма (мода на факт-чекинг и борьбу с фейками) и паранойи (все эти "операции" и т.п.).
AASelivanov
09.10.2022 00:37Прошу прощения, если это будет восприниматься как придирки, но всё же:
1. А какая метрика была использована? Обычная accuracy?
2. А какой набор данных был рассмотрен? Существует ли он в открытом доступе? Какие ресурсы были использованы в качестве источника данных? Сколько текстов приходится на одного пользователя? Кто и по какой методике занимался разметкой данных на "фейки" и правду?
3. Какие-нибудь аналоги использовали? Во всяком случае, для английском языке точно Fake News Detection модели в открытых публикациях описывают. Насколько понимаю, в данном случае речь идёт о русском. Насколько я знаю, данную тематику очень любит профессор К.В. Воронцов, есть ли у него работы на эту тему, рассматривали их?
4. Если упоминается нейронная сеть, хочется знать подробности: что за топология, почему, какие гиперпараметры, как подбирали, какой метод представления текста, сравнивались ли с языковыми моделями?Пока что выходит, что в статьей очень большое введение (о формализации процесса подготовки и вычисления ложных новостей общими словами, без связи с постановкой и решением технической задачи) и маленький хвостик о том, как задачу решали (а ведь это же самое интересное!)
laatoo
144%