Как количество загрузок из Sci-Hub, а также различные характеристики публикаций влияют на будущие цитирования?

Используя данные из 12 ведущих журналов по экономике, неврологии и междисциплинарным исследованиям, было обнаружено, что статьи, загруженные из Sci-Hub, цитировались в 1,72 раза чаще, чем статьи, не загруженные из Sci-Hub. Также число загрузок из Sci-Hub является надежным предиктором будущих цитирований. Ограниченный доступ к публикациям может помешать некоторым научным исследованиям достичь полноценной отдачи.

Наука и ее результаты необходимы в повседневной жизни, поскольку они помогают понять наш мир и обеспечивают основу для принятия лучших решений. Хотя научные результаты часто цитируются в социальных сетях и распространяются за пределами научного сообщества, их основное использование — это то, что мы могли бы назвать «научным потреблением». Это явление включает в себя использование веб-сайтов, которые предоставляют доступ на основе подписки к обширным базам данных научных исследований. Несмотря на наличие локальных баз данных в каждом регионе мира, наиболее широко используются Web of Science и Scopus.

Однако использование этих баз данных меняется с появлением альтернативных сервисов, таких как SciArticle, сканирующий базы Library Genesis, Paperhub, Sci-Hub, которые предоставляют бесплатный доступ к научным публикациям без учета их авторского права. В частности, Sci-Hub приобрел всемирную известность как инициатива, имеющая широкие последствия для всех, кто принадлежит к глобальной академической системе.

Поскольку Sci-Hub предоставляет доступ почти ко всей научной литературе любому, у кого есть подключение к Интернету, некоторые ученые предполагают, что традиционная бизнес-модель, основанная на подписке на журналы, может стать неустойчивой. Поскольку это обстоятельство выводит как юридические, так и этические проблемы за рамки данной работы, мы не будем останавливаться на этих вопросах, уже освещенных в юридической литературе.

До Интернета Ирвин Луи Горовиц (1986), вероятно, был первым ученым, заговорившим о доступе к опубликованным научным знаниям. Несмотря на то, что в более поздних работах по этому вопросу не упоминаются его основополагающие идеи, они указывают на фундаментальную проблему. Доступ к научной литературе был неравным в странах с разным уровнем экономического развития. Поскольку Sci-Hub предоставляет доступ к научной литературе ученым как из развитых, так и из развивающихся стран, он может уменьшить это неравенство. Поскольку коллективные продуктивные знания, предоставляемые научной литературой, могут быть одним из движущих механизмов экономического развития, более широкий доступ к этой литературе приведет к большему процветанию, особенно для тех стран, которые раньше имели ограниченный доступ.

Проанализировав загрузки Sci-Hub статей по компьютерным наукам было обнаружино, что Индия, Иран, Китай, США и Индонезия имеют наиболее частое использование Sci-Hub, хотя после нормализации количества загрузок на душу населения, в первую пятерку стран вошли Тунис, Иран, Греция, Марокко и Иордания. В Латинской Америке Бразилия, Мексика, Чили, Колумбия и Аргентина наиболее частое использование Sci-Hub.

Большинство статей, загруженных из Sci-Hub, относятся к области химии, физики и астрономии, а публикации из Elsevier чаще всего запрашиваются украинскими пользователями Sci-Hub.

23,2 миллиона из 27,8 миллионов запросов на загрузку были запросами на журнальные статьи, а большинство запросов на медицинскую литературу исходило от стран с низким и средним уровнем дохода (3,3 миллиона). 2,2 миллиона запросов на загрузку поступили из самых богатых стран.

Вопрос о том, как загрузка Sci-Hub может повлиять на научные цитирования, остается неизвестным. Чтобы дать предварительный ответ на этот вопрос, необходимо знать роль других предикторов. Здесь стоит упомянуть список особенностей, которые делают опубликованную статью высокоцитируемой в будущем. С этим материалом вы можете ознакомиться в нашей прошлой статье Способы повышения индекса Хирша.

Там было показано, что длина названия статьи отрицательно связана с ее годовой цитируемостью. По мнению некоторых ученых, использование графиков и таблиц для сообщения научных результатов также может иметь решающее значение. Область знаний и импакт-фактор журналов также считаются важными предикторами цитирования. Кроме того, на количество цитирований влияет количество авторов на статью и так называемый «эффект сопровождения в научных публикациях», который имеет место, когда старшие ученые появляются в качестве последнего автора статьи, первый автор младший научный сотрудник. Несмотря на предыдущие исследования, роль загрузок Sci-Hub как релевантного предиктора цитирований по-прежнему игнорируется.

Согласно исследованию, с методологией которого вы можете ознакомиться по ссылке, оценка эффекта на цитируемость статей загруженных из Sci-Hub варьировалась от 1,19 до 1,412. Также на данном графике видно, что общее количество рисунков, включенных в статью, наряду с количеством авторов в статье, H-индекс первого автора и импакт-фактор журнала являются важными предикторами.

Оценка эффекта Sci-Hub является значительной, и независимо от спецификации модели эффект находится между 2,215 и 2,460. После проверки всех источников систематической ошибки было обнаружено, что статьи, загруженные из Sci-Hub, цитировались в 1,72 раза чаще, чем статьи, не загруженные из Sci-Hub. Эффект Sci-Hub присутствует во всех журналах и научных дисциплинах, которые были проанализировали.

Помимо эффекта Sci-Hub, было обнаружено, что статьи с большим количеством скачиваний систематически получают больше цитирований. Динамика распространения знаний тесно связана с доступом к научным данным и их использованием. Эффект показывает важность открытого доступа. Sci-Hub почти удваивает цитирование статей, доступ к которым осуществляется через него.


Ссылка на статью

Способы повышения индекса Хирша

Где скачать научную статью легко и доступно?

ВК | ТГ | Блог | Дзен

Комментарии (12)


  1. NeoCode
    12.01.2023 12:43
    +1

    Не знаю является ли цитирование как таковое каким-то важным показателем полезности исследования, но вот с учетом появления ChatGPT и подобных технологий, считаю чрезвычайно важным, чтобы все научные знания - и статьи, и книги - были в открытом доступе. Ведь человек просто физически не может так эффективно анализировать все эти огромные объемы информации, как компьютер. Кто знает, может уже есть какие-то малоизвестные исследования из разных дисциплин, которые, будучи объединены вместе, дадут какой-то научный прорыв?


    1. kablag
      12.01.2023 15:36
      +3

      давно существуют компании (например, отделение Thomson Reuters), которые силами людей обрабатывают статьи – делают из них "выжимки" (например, описание использованных методов или белковых взаимодействий). Потом эти "выжимки" продаются по подписке в виде базы, где можно найти информацию по интересующей области. Вероятно, ChatGPT сможет заменить в этой работе людей (или уже заменяет).


  1. putnik
    12.01.2023 12:49
    +14

    Ок, я вижу корреляцию, но откуда вы делаете вывод, что скачиваемость влияет на цитируемость? Что мне мешает перевернуть оси и сказать, что цитируемость влияет на скачиваемость?


    1. adeshere
      12.01.2023 15:24
      +1

      Присоединяюсь к вопросу. Не знаю, как сейчас, а раньше был какой-то механизм загрузки статей на Sci-Hub по запросу. Но это автоматически создает перекос востребованности, когда более нужные статьи имеют больше шансов быть загруженными на Sci-Hub. Что опять-таки приведет к корреляции между загрузками и цитируемостью.

      Что, впрочем, нисколько не умаляет важность и нужность самого инструмента.


    1. kablag
      12.01.2023 15:39

      как правило, статью читают, а потом цитируют в своей. Но когда читают цитату уже в готовой статье мало кто лезет в первоисточник :) Учёные ленивы по своей сути :)


      1. SergeyMax
        12.01.2023 15:52

        Да, но на одно цитирование сколько приходится чтений?


        1. kablag
          12.01.2023 15:57
          +1

          не так уж и много :) Научные статьи, кроме самых популярных, это междусобойчики внутри узких групп учёных. Но мысль верная, нужно копать в эту сторону


    1. NNikolay
      13.01.2023 07:03

      Они пытались как-то отфильтровать во времени. Смотрели на скачивания до цитирования. Но роль sci-hub это не показывает. Более интересные статьи сначала больше читают, а потом больше цитируют. Велика новость.

      Вот если бы был некий сегмент (издательство, список журналов), которые везде доступны, а на sci-hub забанены... Можно было бы измерить что-то более интересное. Ну или если бы у нас была надёжная статистика по скачиваю статей со всех других источников кроме sci-hub, тоже можно было бы покрутиться.


  1. CrocoCat
    12.01.2023 14:06

    Я извиняюсь, немного не в тему, наверное. Коллеги, никто не в курсе Nexus Search Bot не возродился в какой-нибудь новой ипостаси? А то, помер, и стало совсем тоскливо с поиском и скачиванием статей.


    1. ru1z
      12.01.2023 15:58
      +1

      @nexus_search_1_bot


      1. CrocoCat
        12.01.2023 16:59
        +1

        Спасибо огромное!


  1. sentimentaltrooper
    12.01.2023 22:08
    +3

    Цитируемость vs SciHub. Когда я писал статьи и кого-то цитировал, то подписка на всё у меня была от университета и никакой SciHub мне было не важен и не нужен. Был важен impact factor журнала в котором публиковаться. Сейчас я не работаю на университет и SciHub и arxiv нежно люблю, но...я ничего более не публикую и никого не цитирую. Поэтому, не отрицая корреляцию, задаюсь вопросом о причинноследовательной связи.