У человечества ограничен доступ к наиболее полным источникам научного знания — научным журналам. Во многом такая печальная картина сложилась из-за коммерческой политики издательств и платных подписок, а также предположения, что факт публикации в «платном» журнале является доказательством научной значимости открытия.

В отличие от издательств, большинству людей понятно, что свободные научные знания — это благо для всех (и это благо больше, чем «фильтрация» качественных статей в авторитетных изданиях, см. информационный парадокс Эрроу). Существует ряд научных проектов, которые финансируются в основном из государственных субсидий, при этом открыты бесплатно. Это, например, банки физических объектов, такие как банки семян и репозитории модельных организмов — ряд исследований показывает, что создание таких открытых банков способствовало научной активности в данном направлении. Есть и бесплатные открытые для всех информационные репозитории, как проект «Геном Человека» или StackOverflow.com (источник знаний в области компьютерного программирования).

Википедия — крупнейший в мире источник научной информации для широкой публики. Это вообще 5-й по популярности сайт в интернете. Сейчас пара учёных из Массачусетского технологического института и Питтсбургского университета опубликовали научную статью в пользу того, что Википедия способствует распространению научных знаний, её читают и используют учёные, ставят на неё ссылки в своих научных работах, и Википедия во многом формирует направление научных исследований в принципе.

В своей статье авторы цитируют Чарльза Дарвина из его письма к коллеге-биологу Томасу Генри Хаксли в 1865 году: «Я иногда думаю, что общие и популярные трактаты почти так же важны для прогресса науки, как оригинальное произведение». В конце концов, его «Происхождение видов» было одновременно и выдающейся научной работой, и бестселлером.

Количество научных статей в англоязычной Википедии, в зависимости от определения и методов подсчёта, от 500 тыс. до 1 млн. Авторы говорят, что в области химии, которую проверили для эксперимента, 93% научных статей объясняют тему на уровне начальных курсов специализированных вузов, а 47% статей объясняют тему на уровне старших курсов.



На таком уровне совершенно очевидно, что Википедия объективно отражает науку. Но вопрос в том, как она влияет на науку, насколько учёные читают Википедию, и может ли Википедия повлиять на активность научных исследований?

В данном случае тема изучалась с помощью двух подходов. Во-первых, вычисление встречаемости научных терминов на страницах Википедии и на страницах научных журналов. Авторы обработали полную историю правок всех статей (20 терабайт данных) и все полные версии статей двух тысяч научных журналов Elsevier с 1995 года (0,6 терабайт).

Разумеется, эти словарные базы во многом пересекаются. Так, 61% слов из научной литературы встречается в Википедии, а 63% слов из последней встречается в научной литературе. Однако относительная частотность слов в некоторых случаях заметно отличается.
Слово Место в научной литературе Место в Википедии
Acid 59 65
Reaction 32 132
Graphene 2143 3099
Photovoltaic 5764 7651
Gravity 6139 2375
Pokemon 745 676 14 485

В своих измерениях учёные, естественно, сделали поправку на языковой дрифт, то есть изменение частотности терминов со временем.


Изменение частотности во времени некоторых терминов по химии

Второй подход — экспериментальный. Экспертам по определённым темам предложили написать ряд статей для Википедии. Затем случайная половина этих статей реально публиковалась на сайте, а вторая половина сохранялась в качестве контрольной выборки. Впоследствии учёные изучали, насколько в научной литературе повысилась частотность слов из опубликованных статей и из статей контрольной группы. Результаты эксперимента подтвердили догадку: слов из статей Википедии в литературе оказалось больше. Это доказывает, что Википедия действительно оказывает влияние на текущие научные исследования.



Внедрение определённой информации в Википедию влияет на будущие научные исследования. Это означает не только большую значимость самой Википедии, но и большое значение открытых научных знаний в принципе. У статьи за платным файрволом гораздо меньше шансов оказать влияние на научное сообщество и на всё общество в целом, чем у статьи в открытом доступе. Получается, что открытая публикация статей — это очень экономически выгодный способ развивать науку. Эта выгода гораздо больше, чем выгода от «фильтрации» статей в платных журналах.

Авторы научной работы уверены, что теперь никак неуместно говорить, что Википедия — это просто источник общеизвестных знаний.

Комментарии (34)


  1. Zenitchik
    21.09.2017 16:21
    +2

    ставят на неё ссылки в своих научных работах

    А ничего, что такие ссылки не считаются авторитетными согласно правил самой же Википедии?


    1. Germanets
      21.09.2017 16:25
      +4

      Более того, во многих отечественных учебных заведениях подобные ссылки автоматически ставят под сомнения такую научную работу и запрещают её принятие от студента\аспиранта и т.д.


      1. den_golub
        21.09.2017 17:33
        +9

        Заходим на википедию, листаем до ссылок на которые она ссылается, копируем небольшую часть, вставляем в работу, профит


        1. Zenitchik
          21.09.2017 17:56
          +5

          А ссылки на источники в тексте как расставите? Знаете такие в квадратных скобочках.
          Для этого придётся в источник заглянуть и цитату проверить. Т.о. мы приходим к честному использованию источников, а Википедия нам помогла их найти.


          1. ozonar
            22.09.2017 12:50
            +1

            Если вы студент-халявщик, то заменяем ссылку на википедию на любую более подходящую к тексту ссылку из источников.

            С учётом того, что рецензент просил меня самого составить рецензию, а проверяющих на самом приёме диплома больше интересовали папочки в которые я завернул раздаточную литературу, чем сам диплом, никто не заметит и не будет проверять


            1. Zenitchik
              22.09.2017 14:04
              +2

              Сочувствую.


              1. ozonar
                22.09.2017 14:54
                +3

                Получение высшего образования все же не помешало мне выучится в хорошего специалиста (наверное), поэтому нет смысла для сочувствий. Но да, хапнуть серьезного подхода к обучению мне таки не удалось


            1. Exchan-ge
              23.09.2017 00:38
              +1

              «сам диплом, никто не заметит и не будет проверять»

              Это либо было давно, либо вам повезло (или ВУЗ был такой).
              Сейчас все источники пробиваются за пять минут.

              Методика очень простая — работа просматривается по диагонали и в ней ищутся самые интересные места (преподаватель знает, какие именно :)
              Остальное — дело техники.


      1. Zenitchik
        21.09.2017 17:57
        +1

        Это естественное следствие неавторитетности источника.


    1. Revetements_Etales
      21.09.2017 18:01

      В оригинальной статье об этом тоже сказано.

      Unfortunately, measuring the impact of Wikipedia using citations is difficult for two reasons. First,
      purported experts might be reluctant to admit that they referenced an encyclopedia for their
      knowledge, and thus not cite Wikipedia even if they used it. Indeed, university guidelines
      specifically discourage the citation of Wikipedia, as MIT citation guidelines make clear

      integrity.mit.edu/handbook/citing-your-sources/citing-electronic-sources
      Wikipedia is Not a Reliable Academic Source
      Many of us use Wikipedia as a source of information when we want a quick explanation of something. However, Wikipedia or other wikis, collaborative information sites contributed to by a variety of people, are not considered reliable sources for academic citation, and you should not use them as sources in an academic paper.


      Тем не менее, там есть отсылка к исследованию 2016 года:

      Tomaszewski and MacDonald (2016) find that only 0.01% of scientific
      articles directly cite Wikipedia entries.

      dx.doi.org/10.1080/0194262X.2016.1206052
      A Study of Citations to Wikipedia in Scholarly Publications

      For the study period from 2002–2015, citations in approximately 16.6 million
      peer-reviewed articles across the three WoS citation indexes were searched.
      This research identified a total of 1,551 citations to Wikipedia (Table 1). For the sake of expedient
      analysis, the authors assume one Wikipedia citation per article relationship.
      This suggests that approximately 0.0099% of scholarly articles contain a cita-
      tion to Wikipedia.


      Т.е из 16.6 миллионов работ, около ~1500 имеют ссылки на википедию (В основном Китай и США)


      1. Zenitchik
        21.09.2017 18:16
        +2

        Похоже, в мировой науке наблюдается острый дефицит технических средств воспитания…


      1. Celahir
        22.09.2017 08:26

        Предположу, что существенная часть этих статей изучает влияние Википедии непосредственно. Ни один крупный зарубежный научный журнал не примет ссылку на Википедию, если она не является объектом исследования. Как пример: данная научная работа не может не иметь ссылки на Википедию, как источника, но этот факт не делает исследование менее значимым.


    1. saboteur_kiev
      21.09.2017 18:36
      +1

      С другой стороны в Википедии принято в конце статьи перечислять первоисточники.

      Кто сомневается в достоверности — может в той же википедии найти ссылку на первоисточник, который может оказаться достаточно авторитетным.


      1. dimm_ddr
        21.09.2017 18:39
        +2

        А может не найти. В википедии много статей в которых источники достаточно сомнительные или мертвые. Во втором случае можно поверить что там было что-то достаточного качества, но это так себе решение.


        1. Inflame
          21.09.2017 19:49
          +2

          В большинстве случаев мёртвую статью можно найти в Архиве Интернета.


      1. Revetements_Etales
        21.09.2017 18:53

        Есть и обратная сторона медали — ссылка на хорошую статью в вики еще не гарантирует того, что сама статья является хорошей.
        arxiv.org/abs/1703.03827 как пример. 5 ссылок на вики, и даже одна на stackexchange.
        (автор, кстати, д-р физ.-мат. наук iitp.ru/en/users/47.htm)


      1. Zenitchik
        21.09.2017 18:59
        +1

        А почему было не сделать это автору статьи? Тогда и вопросов бы не было.


        1. mistergrim
          22.09.2017 01:25

          Автор-то делает, но викимодераторам виднее.


          1. Zenitchik
            22.09.2017 11:48

            Причём тут викимодеаторы?


      1. Exchan-ge
        23.09.2017 00:33
        +2

        «Кто сомневается в достоверности — может в той же википедии найти ссылку на первоисточник»

        Поскольку такую проверку я делаю постоянно — могу сказать, что в русскоязычной вики «левых» источников достаточно много. Включая ссылки на сайты с явно бредовой информацией (типа РенТВ).
        Не надейтесь, на то, что эти ссылки кто-то реально проверяет.


  1. dimm_ddr
    21.09.2017 18:37

    В отличие от издательств, большинству людей понятно, что свободные научные знания — это благо для всех

    Ну что за демагогические приемы в текстах про пользу открытой науки? Ну некрасиво же.


    Количество научных статей в англоязычной Википедии, в зависимости от определения и методов подсчёта, от 500 тыс. до 1 млн. Авторы говорят, что в области химии, которую проверили для эксперимента, 93% научных статей объясняют тему на уровне начальных курсов специализированных вузов, а 47% статей объясняют тему на уровне старших курсов.

    На таком уровне совершенно очевидно, что Википедия объективно отражает науку. Но вопрос в том, как она влияет на науку, насколько учёные читают Википедию, и может ли Википедия повлиять на активность научных исследований?


    На каком уровне? Кому очевидно? Мне — не очевидно. Я вообще не до конца понимаю что за цифры приведены в таблице. 93 + 47 != 100, значит они либо пересекаются, чего вроде бы не должно быть, если статья объясняет на уровне начального курса, то она не может одновременно объяснять и на уровне старшего. Либо второй процент берется от остатка, но этому противоречат уже цифры в таблице, остаток в первой строке 46, а во второй строке общее количество 136.


  1. Bhudh
    21.09.2017 21:34
    +1

    Результаты эксперимента подтвердили догадку: слов из статей Википедии в литературе оказалось больше. Это доказывает, что Википедия действительно оказывает влияние на текущие научные исследования.
    То есть учёные подтвердили, что студенческие работы в рецензируемые журналы делаются путём рерайтинга статей Википедии. Прэлэстно, просто прэлэстно.


    1. trir
      22.09.2017 07:20

      скорее о нормализации терминалогии
      между прочим во всём мире записывают математические выражения, в точности (почти =) как в одной книжке 17-го века


  1. KOLANICH
    22.09.2017 01:13

    Некоторое время назад пытался распарсить википедию на базу данных. Так вот: к парсингу на базу она непригодна совсем. Шаблоны — они хоть и шаблоны, но данные в них в свободной форме. А для использования их надо нормализовать. Вот только для нормализации их надо корректно распарсить, но там формата как такового нет, в шаблонах зачастую вообще встречаются некорректные данные, в.т.ч с опечатками. Ссылки тоже чёрте как. Геморроиться не захотел и забил, так как оказалось не особо нужно. Может для исследователей нейросетей она и полезна, но вот для парсинга на базу оказалась почти бесполезна.


    1. nikolay_karelin
      24.09.2017 09:11
      +1

      Проект dbpedia не смотрели? Он уже достаточно зрелый и вроде именно парсинг в базу и делает.


  1. San_tit
    22.09.2017 01:23
    +3

    Я уж не знаю как там Вики может значительно влиять на науку, но конкретно в моей области (теория управления) содержание Википедии ограничивается первыми (вводными) курсами дисциплин. Т.е. грубо говоря базовые формулы и понятия.
    Хотя согласен, что так или иначе она, естественно, используется (хотя, чем серьезнее исследование, тем меньше)


    1. Avenger911
      22.09.2017 09:29
      +2

      Тут ещё не стоит забывать, что исследовалась английская Википедия, а русская ей по уровню действительно во многом уступает.


  1. trir
    22.09.2017 07:15
    +1

    Pokemon?


  1. maxDanylenko
    22.09.2017 08:26
    -1

    Статьи заблокированные, роскомнадзор, на науку в Рашке никак не влияют)) Ох и заминусуют, понеслась)))


  1. fedison
    22.09.2017 08:26
    -1

    скорее через Википедию пытаются влиять


  1. useluch
    22.09.2017 08:26
    +3

    В научных статьях принято ставить ссылки на первоисточники, а Википедия первоисточником не является.
    К слову, SSRN — это сервис препринтов для социальных и гуманитарных наук, так что с большой вероятностью статья не была рецензирована, а раз так, то называть её научной рано.


  1. trir
    22.09.2017 08:46
    +1

    Статья не про ссылки, а про слова/термины — она про нормализацию терминологии


  1. technarium
    22.09.2017 17:41

    Речь о том, что это структурированный источник. По нему быстрее можно найти факты и природу явлуний в новой области. А уж потом бегать по статьям.


  1. nikolay_karelin
    24.09.2017 09:35
    +2

    К сожалению, Википедия все-таки не слишком надежна: в любой момент статья может стать жертвой вандала безответственного экспериментатора. Как на мой опыт — статья в Википедии это отличный способ начального знакомства с каким-то понятием или фактом, но потом надо очень многое перепроверить.


    С дугой стороны, встречался с ситуацией, когда автора вузовского учебника (американский профессор Аллен Дауни) совершенно спокойно и сознательно дает ссылки на Википедию по основным понятиям матстатистики — он обосновывал, что по его мнению в этой области материалы как правило высокого качества и будут однозначно подходить его студентам.


    Ну и последнее: по-моему, противопоставлять Википедию и научные статьи по меньшей мере некорректно. Еще в доинтерненую эпоху были энциклопедии, и отличнейшие, но для научной работы все равно надо было ссылаться на оригинальные статьи, иначе результат выглядел странно. Было бы интересно увидеть проценты ссылок из научных статей на, допустим, Британнику, за 20-й век :)