Группа исследователей обнаружила «эффект Sci-Hub», при котором скачиваемость научных статей с ресурса влияет на их цитируемость. Такие публикации, как правило, цитируют в 1,72 раза чаще, подсчитали авторы работы. 

Sci-Hub
Sci-Hub

Исследователи использовали для анализа 8661 статью, половину из которых можно было скачать со Sci-Hub, а вторую половину — нет. При анализе учитывались длина статьи, количество формул, длина заголовка, количество авторов, индекс Хирша первого автора и влиятельность журнала публикации.

Исследуемые статьи публиковались в трех мультидисциплинарных журналах (Nature, Science, and Proceedings of the National Academy of Sciences), трех экономических журналах (The Quarterly Journal of Economics, Journal of Political Economy, and Econometrica), трех журналах потребительских исследований (Journal of Consumer Research, Journal of Retailing and Consumer Services, and Journal of Consumer Psychology) и три неврологических журналах (Nature Reviews Neuroscience, Nature Neuroscience и Neuron). Статьи публиковались в период с сентября 2015 года по февраль 2016 года. 

Исследователи обнаружили, что статьи, загруженные с Sci-Hub, цитировались чаще. Хуан К. Корреа, междисциплинарный исследователь, который претендует на членство Школы бизнеса CESA в Боготе, отметил, что «исследователи из неразвитых стран сталкиваются с большими трудностями при получении доступа к материалам». По его мнению, модель подписок на журналы может стать неустойчивой в будущем именно благодаря существованию таких ресурсов, как Sci-Hub.

Теперь Корреа планирует изучить более широкий набор научных журналов, чтобы доказать непротиворечивость первых статистических результатов.

Все данные, коды и анализ представлены учеными в открытом научном репозитории, чтобы облегчить дальнейшую работу тем, кто интересуется темой.

Sci-Hub насчитывает 85 миллионов статей. Гигант научных публикаций Elsevier в 2015 году подал против ресурса иск, потребовав $15 млн. Суд удовлетворил этот иск, но Sci-Hub отказался выплачивать деньги.

Министерство юстиции США ведет расследование в отношении Sci-Hub с 2019 года на предмет предполагаемых связей с российскими спецслужбами. Twitter заблокировал аккаунт Sci-Hub в январе после судебных исков, поданных индийскими учеными. ЕС добавил ресурс в список отслеживания пиратства.

7 мая основатель ресурса Александра Элбакян сообщила, что ФБР отслеживает ее Apple-аккаунт более двух лет. Сама она ранее зарегистрировала Sci-Hub в сети распределенных доменных имен Handshake.

В конце мая подреддит энтузиастов-архивистов /r/DataHoarder решил сохранить 77 ТБ научных данных Sci-Hub. С декабря 2020 года ресурс не обновлялся.

Комментарии (3)


  1. mSnus
    15.07.2021 14:51
    +7

    Удивительное дело: статьи, к которым есть халявный доступ, цитируются чаще, чем те, к которым доступ ограничен!


  1. DistortNeo
    15.07.2021 14:57
    +2

    Это следствие принципа "publish or perish". Нужно много публиковаться, но при этом публикации должны соответствовать формальным критериям. Нельзя опубликовать работу, которая не имеет адекватного списка цитируемой литературы и достойного введения с анализом литературы. Поэтому автор идёт в поиск и ищет работы по тематике. Обычно работ по тематике — сотни и тысячи, и проанализировать всё — задача нереальная. В итоге автор просто отбирает несколько работ, к которым смог получить доступ, и ссылается на них. Если же к работе сложно получить доступ, то и хрен с ней, автор просто пропустит её и сошлётся на другую.


  1. AC130
    15.07.2021 17:29
    +2

    1)

    половину из которых можно было скачать со Sci-Hub, а вторую половину — нет

    The first data set contained all articles that were downloaded from Sci-hub between September 2015 and February 2016. The second data set was extracted from the Scopus database and contained all articles published in the selected journals within the same time period. From this data set, we excluded articles already present in the first data set. For each journal, we next selected an equivalent number of articles as were included in the first data set. After the selection, the second data set had a total of 4,015 articles which we used in the analysis. Since this data set included only articles that had not been downloaded from Sci-hub, we use it as a control group.

    Т.е. о том, были ли статьи доступны на Скай-Хабе, ни слова; второй датасет содержит статьи, которые просто никто не скачивал, независимо от того были они на Скай-Хабе или нет. Большого удивления тот факт, что никого не заинтересовавшие статьи получили меньше цитат, у меня не вызывает.

    2)

    Our central hypothesis is that the access of articles through Sci-hub is associated with a higher number of future citations because it bypasses the obstacles imposed by paid subscription-based information retrieval services, and thus it increases the potential impact of the article.

    Однако влияние на цитирования такого фактора, как "статья доступна в Open Access или нет", вообще не рассмотрено.

    3)

    Besides the Sci-hub effect, we also found that articles with a higher number of figures systematically receive more citations. This finding is particularly revealing from the role of graphs and tables as techniques to summarize results or depict relationships among variables in empirical articles. Given that the number of tables in a paper was not a significant predictor of its citations, the use of graphs in an article could not be driven by the “hardness” of a discipline or a similar factor that is shared between figures and tables. The effect must be driven by specific advantages of figures. As described in a seminal paper by Anscombe, graphs make understanding the information of a paper easier, and we show that the articles using them are more likely to be cited as a consequence. The decision to include graphs in an article might thus be one of the mechanisms that promote understanding and further use of scientific findings. Researchers could exploit this finding as a mechanism to maximize the impact of their research.

    Возможно. А ещё возможно, что чем больше в статье графиков -- тем больше в статье результатов по теме исследования и тем больше различных утверждений относительно этих результатов, а значит больше утверждений, на которые могут ссылаться другие статьи в том или ином ключе.