В отличие от издательств, большинству людей понятно, что свободные научные знания — это благо для всех (и это благо больше, чем «фильтрация» качественных статей в авторитетных изданиях, см. информационный парадокс Эрроу). Существует ряд научных проектов, которые финансируются в основном из государственных субсидий, при этом открыты бесплатно. Это, например, банки физических объектов, такие как банки семян и репозитории модельных организмов — ряд исследований показывает, что создание таких открытых банков способствовало научной активности в данном направлении. Есть и бесплатные открытые для всех информационные репозитории, как проект «Геном Человека» или StackOverflow.com (источник знаний в области компьютерного программирования).
Википедия — крупнейший в мире источник научной информации для широкой публики. Это вообще 5-й по популярности сайт в интернете. Сейчас пара учёных из Массачусетского технологического института и Питтсбургского университета опубликовали научную статью в пользу того, что Википедия способствует распространению научных знаний, её читают и используют учёные, ставят на неё ссылки в своих научных работах, и Википедия во многом формирует направление научных исследований в принципе.
В своей статье авторы цитируют Чарльза Дарвина из его письма к коллеге-биологу Томасу Генри Хаксли в 1865 году: «Я иногда думаю, что общие и популярные трактаты почти так же важны для прогресса науки, как оригинальное произведение». В конце концов, его «Происхождение видов» было одновременно и выдающейся научной работой, и бестселлером.
Количество научных статей в англоязычной Википедии, в зависимости от определения и методов подсчёта, от 500 тыс. до 1 млн. Авторы говорят, что в области химии, которую проверили для эксперимента, 93% научных статей объясняют тему на уровне начальных курсов специализированных вузов, а 47% статей объясняют тему на уровне старших курсов.
На таком уровне совершенно очевидно, что Википедия объективно отражает науку. Но вопрос в том, как она влияет на науку, насколько учёные читают Википедию, и может ли Википедия повлиять на активность научных исследований?
В данном случае тема изучалась с помощью двух подходов. Во-первых, вычисление встречаемости научных терминов на страницах Википедии и на страницах научных журналов. Авторы обработали полную историю правок всех статей (20 терабайт данных) и все полные версии статей двух тысяч научных журналов Elsevier с 1995 года (0,6 терабайт).
Разумеется, эти словарные базы во многом пересекаются. Так, 61% слов из научной литературы встречается в Википедии, а 63% слов из последней встречается в научной литературе. Однако относительная частотность слов в некоторых случаях заметно отличается.
Слово | Место в научной литературе | Место в Википедии |
---|---|---|
Acid | 59 | 65 |
Reaction | 32 | 132 |
Graphene | 2143 | 3099 |
Photovoltaic | 5764 | 7651 |
Gravity | 6139 | 2375 |
Pokemon | 745 676 | 14 485 |
В своих измерениях учёные, естественно, сделали поправку на языковой дрифт, то есть изменение частотности терминов со временем.
Изменение частотности во времени некоторых терминов по химии
Второй подход — экспериментальный. Экспертам по определённым темам предложили написать ряд статей для Википедии. Затем случайная половина этих статей реально публиковалась на сайте, а вторая половина сохранялась в качестве контрольной выборки. Впоследствии учёные изучали, насколько в научной литературе повысилась частотность слов из опубликованных статей и из статей контрольной группы. Результаты эксперимента подтвердили догадку: слов из статей Википедии в литературе оказалось больше. Это доказывает, что Википедия действительно оказывает влияние на текущие научные исследования.
Внедрение определённой информации в Википедию влияет на будущие научные исследования. Это означает не только большую значимость самой Википедии, но и большое значение открытых научных знаний в принципе. У статьи за платным файрволом гораздо меньше шансов оказать влияние на научное сообщество и на всё общество в целом, чем у статьи в открытом доступе. Получается, что открытая публикация статей — это очень экономически выгодный способ развивать науку. Эта выгода гораздо больше, чем выгода от «фильтрации» статей в платных журналах.
Авторы научной работы уверены, что теперь никак неуместно говорить, что Википедия — это просто источник общеизвестных знаний.
Комментарии (34)
dimm_ddr
21.09.2017 18:37В отличие от издательств, большинству людей понятно, что свободные научные знания — это благо для всех
Ну что за демагогические приемы в текстах про пользу открытой науки? Ну некрасиво же.
Количество научных статей в англоязычной Википедии, в зависимости от определения и методов подсчёта, от 500 тыс. до 1 млн. Авторы говорят, что в области химии, которую проверили для эксперимента, 93% научных статей объясняют тему на уровне начальных курсов специализированных вузов, а 47% статей объясняют тему на уровне старших курсов.
На таком уровне совершенно очевидно, что Википедия объективно отражает науку. Но вопрос в том, как она влияет на науку, насколько учёные читают Википедию, и может ли Википедия повлиять на активность научных исследований?
На каком уровне? Кому очевидно? Мне — не очевидно. Я вообще не до конца понимаю что за цифры приведены в таблице. 93 + 47 != 100, значит они либо пересекаются, чего вроде бы не должно быть, если статья объясняет на уровне начального курса, то она не может одновременно объяснять и на уровне старшего. Либо второй процент берется от остатка, но этому противоречат уже цифры в таблице, остаток в первой строке 46, а во второй строке общее количество 136.
Bhudh
21.09.2017 21:34+1Результаты эксперимента подтвердили догадку: слов из статей Википедии в литературе оказалось больше. Это доказывает, что Википедия действительно оказывает влияние на текущие научные исследования.
То есть учёные подтвердили, что студенческие работы в рецензируемые журналы делаются путём рерайтинга статей Википедии. Прэлэстно, просто прэлэстно.trir
22.09.2017 07:20скорее о нормализации терминалогии
между прочим во всём мире записывают математические выражения, в точности (почти =) как в одной книжке 17-го века
KOLANICH
22.09.2017 01:13Некоторое время назад пытался распарсить википедию на базу данных. Так вот: к парсингу на базу она непригодна совсем. Шаблоны — они хоть и шаблоны, но данные в них в свободной форме. А для использования их надо нормализовать. Вот только для нормализации их надо корректно распарсить, но там формата как такового нет, в шаблонах зачастую вообще встречаются некорректные данные, в.т.ч с опечатками. Ссылки тоже чёрте как. Геморроиться не захотел и забил, так как оказалось не особо нужно. Может для исследователей нейросетей она и полезна, но вот для парсинга на базу оказалась почти бесполезна.
nikolay_karelin
24.09.2017 09:11+1Проект dbpedia не смотрели? Он уже достаточно зрелый и вроде именно парсинг в базу и делает.
San_tit
22.09.2017 01:23+3Я уж не знаю как там Вики может значительно влиять на науку, но конкретно в моей области (теория управления) содержание Википедии ограничивается первыми (вводными) курсами дисциплин. Т.е. грубо говоря базовые формулы и понятия.
Хотя согласен, что так или иначе она, естественно, используется (хотя, чем серьезнее исследование, тем меньше)Avenger911
22.09.2017 09:29+2Тут ещё не стоит забывать, что исследовалась английская Википедия, а русская ей по уровню действительно во многом уступает.
maxDanylenko
22.09.2017 08:26-1Статьи заблокированные, роскомнадзор, на науку в Рашке никак не влияют)) Ох и заминусуют, понеслась)))
useluch
22.09.2017 08:26+3В научных статьях принято ставить ссылки на первоисточники, а Википедия первоисточником не является.
К слову, SSRN — это сервис препринтов для социальных и гуманитарных наук, так что с большой вероятностью статья не была рецензирована, а раз так, то называть её научной рано.
technarium
22.09.2017 17:41Речь о том, что это структурированный источник. По нему быстрее можно найти факты и природу явлуний в новой области. А уж потом бегать по статьям.
nikolay_karelin
24.09.2017 09:35+2К сожалению, Википедия все-таки не слишком надежна: в любой момент статья может стать жертвой
вандалабезответственного экспериментатора. Как на мой опыт — статья в Википедии это отличный способ начального знакомства с каким-то понятием или фактом, но потом надо очень многое перепроверить.
С дугой стороны, встречался с ситуацией, когда автора вузовского учебника (американский профессор Аллен Дауни) совершенно спокойно и сознательно дает ссылки на Википедию по основным понятиям матстатистики — он обосновывал, что по его мнению в этой области материалы как правило высокого качества и будут однозначно подходить его студентам.
Ну и последнее: по-моему, противопоставлять Википедию и научные статьи по меньшей мере некорректно. Еще в доинтерненую эпоху были энциклопедии, и отличнейшие, но для научной работы все равно надо было ссылаться на оригинальные статьи, иначе результат выглядел странно. Было бы интересно увидеть проценты ссылок из научных статей на, допустим, Британнику, за 20-й век :)
Zenitchik
А ничего, что такие ссылки не считаются авторитетными согласно правил самой же Википедии?
Germanets
Более того, во многих отечественных учебных заведениях подобные ссылки автоматически ставят под сомнения такую научную работу и запрещают её принятие от студента\аспиранта и т.д.
den_golub
Заходим на википедию, листаем до ссылок на которые она ссылается, копируем небольшую часть, вставляем в работу, профит
Zenitchik
А ссылки на источники в тексте как расставите? Знаете такие в квадратных скобочках.
Для этого придётся в источник заглянуть и цитату проверить. Т.о. мы приходим к честному использованию источников, а Википедия нам помогла их найти.
ozonar
Если вы студент-халявщик, то заменяем ссылку на википедию на любую более подходящую к тексту ссылку из источников.
С учётом того, что рецензент просил меня самого составить рецензию, а проверяющих на самом приёме диплома больше интересовали папочки в которые я завернул раздаточную литературу, чем сам диплом, никто не заметит и не будет проверять
Zenitchik
Сочувствую.
ozonar
Получение высшего образования все же не помешало мне выучится в хорошего специалиста (наверное), поэтому нет смысла для сочувствий. Но да, хапнуть серьезного подхода к обучению мне таки не удалось
Exchan-ge
«сам диплом, никто не заметит и не будет проверять»
Это либо было давно, либо вам повезло (или ВУЗ был такой).
Сейчас все источники пробиваются за пять минут.
Методика очень простая — работа просматривается по диагонали и в ней ищутся самые интересные места (преподаватель знает, какие именно :)
Остальное — дело техники.
Zenitchik
Это естественное следствие неавторитетности источника.
Revetements_Etales
В оригинальной статье об этом тоже сказано.
integrity.mit.edu/handbook/citing-your-sources/citing-electronic-sources
Тем не менее, там есть отсылка к исследованию 2016 года:
dx.doi.org/10.1080/0194262X.2016.1206052
A Study of Citations to Wikipedia in Scholarly Publications
Т.е из 16.6 миллионов работ, около ~1500 имеют ссылки на википедию (В основном Китай и США)
Zenitchik
Похоже, в мировой науке наблюдается острый дефицит технических средств воспитания…
Celahir
Предположу, что существенная часть этих статей изучает влияние Википедии непосредственно. Ни один крупный зарубежный научный журнал не примет ссылку на Википедию, если она не является объектом исследования. Как пример: данная научная работа не может не иметь ссылки на Википедию, как источника, но этот факт не делает исследование менее значимым.
saboteur_kiev
С другой стороны в Википедии принято в конце статьи перечислять первоисточники.
Кто сомневается в достоверности — может в той же википедии найти ссылку на первоисточник, который может оказаться достаточно авторитетным.
dimm_ddr
А может не найти. В википедии много статей в которых источники достаточно сомнительные или мертвые. Во втором случае можно поверить что там было что-то достаточного качества, но это так себе решение.
Inflame
В большинстве случаев мёртвую статью можно найти в Архиве Интернета.
Revetements_Etales
Есть и обратная сторона медали — ссылка на хорошую статью в вики еще не гарантирует того, что сама статья является хорошей.
arxiv.org/abs/1703.03827 как пример. 5 ссылок на вики, и даже одна на stackexchange.
(автор, кстати, д-р физ.-мат. наук iitp.ru/en/users/47.htm)
Zenitchik
А почему было не сделать это автору статьи? Тогда и вопросов бы не было.
mistergrim
Автор-то делает, но викимодераторам виднее.
Zenitchik
Причём тут викимодеаторы?
Exchan-ge
«Кто сомневается в достоверности — может в той же википедии найти ссылку на первоисточник»
Поскольку такую проверку я делаю постоянно — могу сказать, что в русскоязычной вики «левых» источников достаточно много. Включая ссылки на сайты с явно бредовой информацией (типа РенТВ).
Не надейтесь, на то, что эти ссылки кто-то реально проверяет.