Раньше считалось, что люди, которые получают новостную информацию через интернет, в меньшей степени подвержены манипуляции общественным сознанием со стороны СМИ. Многие гордо заявляли — «Я телевизор не смотрю, а читаю новости в Интернете». И это звучало так, как будто человек знает правду, в отличие от тех, кто получает новости с помощью электронно-лучевой трубки и динамика телевизора. Может быть когда-то это было правдой, и в Интернете информация не подвергалась цензуре и пропаганде, во что я лично не верю. Но сегодня сложно найти источник новостной информации, который бы не пытался «скормить» народу бесполезный рейтинговый информационный шум.

Мне хотелось бы обсудить фильтрацию информации в Интернете. Добровольную. Пост исключительно дискуссионный, и те, кому интересен данный вопрос добро пожаловать под кат.

Говорить за всех пользователей Интернета я не могу, но несомненно есть люди, которых напрягает невозможность отфильтровать информационный поток. Точнее информационный поток фильтруется, но только в голове. Каждый вынужден пропускать через себя огромное количество информации. Дело усугубляется тем, что новостные порталы всячески пытаются привлечь пользователей формируя заголовки, содержащие обман или хитрость. Под заголовком «Доллар и евро резко укрепились на фоне катастрофического падения цен на нефть», может находится всё что угодно, рост на копейку и падение на тысячные доли процента. Конечно для десятка людей, играющих по-крупному на валютной или сырьевой бирже укрепление действительно резкое, а падение реально катастрофическое. Для основной же массы людей такая информация не имеет значения, а вызывающая формулировка заголовка создана исключительно для того, чтобы новость прочитали как можно больше пользователей, несмотря на её неважность для большинства. Это лишь один пример и можно спорить с его актуальностью, но для меня было главным донести суть.

Коррупция в России, падение самолетов, выборы в США, терроризм, обмен военнопленными, Украина в конце концов. Я спросил себя, что из всего перечисленного для меня действительно важно? Оказалось, что ничего. Я бы с радостью выключил эти новости нажав на кнопку, но к сожалению, не могу. Я знаю о десятках новостных ресурсов. Пользуюсь двумя. Ненавязчиво, в поле зрения попадают новости ещё с пары-тройки ресурсов. Например, на время 11:43 МСК 06.06.2016 все думали, что мне интересно знать о том, что «Надежда Савченко приехала в Донбасс». И я не смог увернутся от этой новости, хотя очень хотелось. В такой ситуации, в голове возникает куча бранных эпитетов в отношении журналистов, разработчиков и администраторов новостных порталов, ну и в конкретном случае в отношении самой Савченко. Последняя, естественно, страдает только от того, что попала под горячую руку и на её месте мог быть Путин с Обамой или ИГИЛ (запрещенная в Российской Федерации террористическая организация). Я этот банкет не заказывал, но почему я должен его оплачивать? Я думаю достаточно лирики, ниже включаю технаря.

Меня уже давно посещает мысль придумать технологию, которая бы помогла решить проблему фильтрации новостной информации в Интернете. Но вот так, сходу, придумать простую и элегантную технологию довольно сложно. Возможно это происходит потому, что данная проблема «высосана из пальца», а может от того, что это очередная попытка автоматизировать не автоматизируемое. Так или иначе лично мне представляется возможным создать подобный сервис. Используя его можно определить шаблон фильтрации, который в дальнейшем можно применить к любой новостной ленте.

Вы скажите, что есть контент фильтры и будете правы, но только от части. Контент фильтры блокируют сайты целиком, а фильтрация должна быть прозрачной. Не просто блокировать сайты с указанными словами, а по-современному «мягко» вычищать страницу с помощью CSS и JS.

Я думаю данной статьи вполне достаточно для начала бурной или не очень дискуссии. Должен ли человек иметь возможность ограничивать поток входящей информации или с этим прекрасно справляется мозг? Ответьте на опрос и поделитесь своим мнением о возможности существования подобной технологии в комментариях.
Нужна ли технология персональной фильтрации информации

Проголосовало 107 человек. Воздержалось 23 человека.

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

Поделиться с друзьями
-->

Комментарии (29)


  1. A_V_E
    14.06.2016 13:32
    -1

    Тестируете почву для очередного закона, товарищ майор?


    1. geotalk
      14.06.2016 13:53
      +3

      Так точно товарищ полковник!


  1. pewpew
    14.06.2016 13:38
    +1

    Мне кажется, желтизну и тон подачи информации легко фильтровать прослойкой между монитором и креслом.
    Есть подача материала и факты. Комикс с учёным и журналистом найдёте сами. У меня всё.


  1. lostpassword
    14.06.2016 13:59

    ниже включаю технаря
    Извините, но что-то последние три абзаца не очень техническими получились.)
    «по-современному «мягко» вычищать страницу с помощью CSS и JS» — это 98-процентный маркетинг. Если не больше.)


    1. Lure_of_Chaos
      14.06.2016 14:06
      +5

      «включаю технаря» и кроме двух слов «CSS» и «JS» никакой технической конкретики… Прямо как в старой шутке «я знаю каратэ, дзюдо, айкидо и еще много страшных слов»…


  1. Lure_of_Chaos
    14.06.2016 14:04
    +4

    Проблема получения информации не в том, что есть «лишняя» информация, а в том, что информации на самом деле не хватает. Т.е. чтобы составить собственное мнение, нужно в голове агрегировать информацию из многих источников, а не фильтровать ее.
    И проблема, ранее телевидения, а теперь и интернета, в том, что отсутствие информации солят пестрыми заголовками и психологической окраской.
    Т.е. даже если питаться пропагандой, но и от «своих» и «чужих», то можно составить свое мнение. Если же увеличивать кол-во «врагов» и городить на них фильтрацию — то после фильтрации останется только та информация, которая соответствует личному предвзятому мнению.

    Скажем, возьмем тот же пример из статьи про «Надежда Савченко приехала в Донбасс». Вопрос — сколько информации в этом, а сколько создание нужного отношения к этому, исходя из додумывания?
    К сожалению, большинство «новостей» состоят именно из такого информационного шума, который никак не скажется на индивиде в зависимости от того, узнает он об этом или вообще нет, но, напитавшись, он начинает считать это очень важным для себя, теряет душевное равновесие, тратит время за продолжением, которое обязательно следует… а практически это знание он никак не может применить, разве что в очередных сплетнях…

    Поэтому, меньше фильтров и заборов, а больше, еще больше информации — вместе с фактами, промыванием мозгов, психологических приемов и пропаганды! а там уж сами разберемся, какое личное мнение составить, и нужно ли иметь какое-то мнение по каждому вопросу или это несущественно…


    1. geotalk
      14.06.2016 15:14

      Благодарю, вы точно уловили мой посыл в статье. Аргументы понятны и приняты :)


    1. KirillFormado
      14.06.2016 15:57

      Я думал о том, как хорошо бы автоматизировать как раз проверку статьи на пруфы. Вот в статье говорится о каком то случившемся факте(и не факт, что он случился), а система уже по ключевым словам нашла другие статьи где, к примеру, этот факт называется ложным. Или факт был, но мнения в других источниках о нем другое.

      Хорошо бы квалифицировать текст. Этот слишком эмоционален, присутствуют обороты и слова свойственные пропаганде. Но тут можно скатиться в субъективизм, если доверить это человеку. В идеале хотелось бы что-то типа натренированной нейронной сети, которая способна классифицировать текст статьи и поиском находить статьи на те же события, но желательно, с другой точкой зрения. Я не спец в машинном обучении, видимо по этому мне кажется, что такая задача вполне может быть решена)


      1. Inna_N
        15.06.2016 09:50

        Можно сделать проще, фильтровать копипасту, например расширение для браузера, подсказывающее в новостном агрегаторе, что статья из источника 1 на 95% равна статье из источника 2. Раздражает, когда сложно найти новые детали новости, а пропаганду и эмоции я бы оставила, предпочитаю сама фильтровать.


        1. geotalk
          15.06.2016 09:55

          Всё верно, вода в новостях тоже является информационным шумом который следовало бы фильтровать.
          Но судя по оценке статьи, если минусы конечно не за орфографию ставили, то за реализацию технологии вряд ли кто возьмется. В тоже время судя по опросу, тема действительно больная и я попал в точку.
          Если честно то я и сам считаю, что такая технология, это чистой воды ипотека авантюра.


  1. dkukushkin
    14.06.2016 14:44

    а по-современному «мягко» вычищать страницу с помощью CSS и JS.

    Даже рекламу не полностью удается вычистить таким образом, к сожалению. Ведь это битва щита и меча.


  1. Gryphon88
    14.06.2016 14:50
    +1

    Фильтровать, имхо, не надо, это можт привести к радикализации мнения. Возьмём для примера персонифицированную выдачу Гугла: на основе запросов и переходов ранжируется выдача, ссылки, по которым вы с большей вероятностью кликните, всплывают, постепенно занимая несколько первых страниц, в итоге создаётся мнение, что у вас много единомышленников (или людей, сходных по привычкам/действиям), потом — что именно ваши привычки/действия/мнения самые правильные (вон же сколько со мной согласны, 5 страниц выдачи!), а потом, что это мнение единственно верное. Ну и святые воины, как вишенка на торте.


    1. geotalk
      14.06.2016 15:16

      Т.е. персонифицированная выдача от гугла это зло?


      1. Gryphon88
        14.06.2016 15:19

        В общем виде — да. Я предпочитаю duckduckgo с уточняющими модификаторами, а у гугла использую только scholar и гуглокниги.


      1. Lure_of_Chaos
        14.06.2016 15:47

        Тут вопрос только в том, выдача ли подстраивается под тебя или она тебя подстраивает?


        1. Gryphon88
          14.06.2016 15:54

          Я считаю, что процесс обоюдный


  1. weedjy
    14.06.2016 15:10

    Задача не из легких. Взять, к примеру, Хабр. Казалось бы, по потокам, по хабам все разнесено, но все равно периодически попадаются интересные статьи в сторонних хабах или, что еще тяжелее отследить, интересные комменты к неинтересным статьям. Если сделать персональную фильтрацию на основе уже имеющейся классификации по потокам/хабам/оценкам статей, есть шанс пропустить что-то интересное. Даже коллаборативная фильтрация в случае попадания в большую группу юзеров со схожими интересами не дает 100%-й результат. Если же классифицировать под определенного человека, нужно собирать огромную статистику по тем статьям, которые ему понравились и не понравились, как-то выделять признаки, почему «статья понравилась» или почему «нет». И надо принять во внимание, что интересы человека меняются с течением времени = в процессе сбора статистики. Да и критериев для классификации «понравилась/не понравилась» будет все больше. В общем, как это совсем персонифицировать мне не очень понятно. Скорее можно отрубить явный мусор по ключевым словам и пополнять базу ключевых слов, что-то вроде борьбы со спамом. Либо довольствоваться не 100%-ым результатом. В любом случае, есть шанс пропустить что-то действительно интересное.


    1. geotalk
      14.06.2016 15:21

      Как-то сложно. Я поднимал вопрос со стороны что я не хочу. Например я не хочу новости про Украину и вуаля — я эти новости больше нигде не вижу. Понравилось / не понравилось немного в другой плоскости.


      1. weedjy
        14.06.2016 16:45
        +1

        А каков критерий классификации новостей про Украину, которые не хочется читать? Может там что-то интересное изобрели, но оно проскочит мимо Вас в соответствии с общим фильтром «не надо ничего про Украину»? Предпочтения человека к выбору интересующей информации описываются очень сложным набором критериев и выявить их для конкретного человека сложно. Имхо даже сам человек не сможет полностью формализовать набор критериев для самого себя (я пытался на примере того же Хабра и ГТ:) но всегда находится что-то, что не попадает в общее правило).

        Если поднимать вопрос только со стороны «что я не хочу», то вариант реализации это аналог спам-фильтра с возможностью персональной настройки правил. Такой сервис не даст 100%-й гарантии, что конкретный человек не пропустит что-то интересное для себя (как и спам-фильтр, который иногда все же пропускает спам). Его можно будет использовать для большинства ресурсов, где достаточно читать только какие-то новости и забивать на те, что обрежутся фильтром. А для специализированных лично мне, как пользователю, будет важно, чтобы ложных срабатываний фильтра не было. Тогда либо не использовать сервис вообще, либо аналога спам-фильтра недостаточно, нужно что-то посложнее.


        1. geotalk
          14.06.2016 17:56

          Вы правы. Это ещё раз доказывает, что информацию ещё долгое время придется фильтровать через серое вещество.


  1. dmitry_dvm
    14.06.2016 15:18
    +2

    Раньше постоянно залипал на фонтанке, ленте, потом медузе и еще на куче новостных сайтов. А потом этот поток говна в голову так надоел, что резко перестал читать любые новости вообще. Стал намного уравновешеннее и добрее. Но иногда всё-таки срываюсь на пару часов.


    1. geotalk
      14.06.2016 15:26

      Это правда, посыл в статье именно об этом. Если не секрет, как считаете, реально ли сделать так, чтобы можно было отключить неудобные новости?


  1. technont64
    14.06.2016 17:52
    +1

    Личный опыт фильтрации информационного шума привел к уже существующим технологиям:
    RSS-стримы + агрегатор-читалка с возможностью фильтрации. Все существующее, ничего нового изобретать не надо :)

    А если попадается что-то настолько жадное, что не дает RSS-поток, то есть vk2rss для синей соц. сети и kimonolabs для остальных сайтов.


  1. ArkturTierry
    14.06.2016 18:14

    Вопрос «желтизны» тем и заголовков, имхо, может решаться только достоверностью источника. В котором уже есть встроенный фильтр, называется «главный редактор». Вопрос про адекватность подачи информации может быть разделен на три подвопроса:
    а. блокировка нежелательного контента (мне неинтересна тема религии, например, от слова совсем),
    б. дополнение неполной или явно ангажированной подачи информации,
    в. соотнесение степени привлекательности заголовка и степень соответствия текста самой статьи (или глубины раскрытия темы). Та самая проблема желтизны отчасти.

    Нежелательный контент можно блокировать по ключевым словам или словосочетаниям, дополнение информации может осуществляться за счет подбора статей с по автопоиску. Ну а желтизна, как я уже писал, имхо -только адекватность источника.


  1. vgsnv
    14.06.2016 18:14

    Я бы очень хотел видеть кнопку на каждом новостном сайте — «отключить плохие новости».
    Вот честно, заходишь с утра, просто на яндекс, и боишься смотреть на заголовки новостей. Там же кошмар, ей-богу.
    Зачем мне все эти кошмары? Вот вытянут всякое непотребство со всего мира и показывают на всеобщее осмотрение. Вот бы все эти «новости» слить в категорию — грязь, криминал или там какие-нибудь сводки.
    Также начинает подташнивать с новостей из-за рубежа, вот честно, мне пофиг, что у них там. Но нет же, я всё время в курсе. А про то что творится за пределом мкад и знать не знаю. Только страшилки только хардкор.


    1. geotalk
      14.06.2016 18:15

      было на lenta.ru в рамках рекламной компании одного известного бренда
      https://tjournal.ru/19392-lentaru-zapustila-rezhim-horoshih-novostei


      1. vgsnv
        15.06.2016 09:14

        жалко, что это было в качестве эксперимента, да и то для рекламы.


  1. RomanPyr
    15.06.2016 02:29
    +1

    Основную повестку дня задают ограниченное число источников (ТАСС, Интерфакс и т.д.), если пробегаться по их ленте, составляя наборы ключевиков, то можно в дальнейшем на уровне файрвола блокировать контент по этим ключевикам. База соответственно должна обновляться ежедневно.

    Задача упрощается тем, что, как правило, при перепечатке в других изданиях, есть ссылка на источник.

    Наверняка, для этой цели можно использовать инструменты, подобные Новотеке Ашманова, предварительно их инвертировав.


  1. correct_ua
    15.06.2016 22:39

    СМИ — это огромные деньги, поэтому завтра ими будет заказан софт, который позволит обходить фильтры будущей системы мониторинга новостей, и все пойдет по новой на круги своя. Каждый мало мальски мыслящий человек, сам в состоянии фильтровать новости, уже видя заголовок и понимая какой группе населения этот месседж предназначен.