Работа над любым исследовательским проектом включает в себя поиск и изучение множества источников информации. Организация этого процесса — непростая задача. Сегодня мы расскажем об инструментах, которые призваны оптимизировать различные ее составляющие.



Фото Joao Silas — Unsplash

Вендоры академического ПО часто работают по принципу сотрудничества с образовательными учреждениями. Если ваша организация не приобрела интересующий вас продукт — организовать доступ к нему может быть тяжело. Если и существуют индивидуальные планы, платить за них из собственного кармана готовы не все. С другой стороны, открытые или бесплатные продукты, созданные академиками, нередко страдают от неудобного дизайна и отсутствия поддержки.

Можно попробовать много разных инструментов, прежде чем остановиться на рабочем варианте. Мы решили рассказать о наиболее заметных на Hacker News и в подборках на GitHub.

Поиск источников


DOAJ — курируемый каталог открытых научных журналов. В его базе — более 4 миллионов статей из 13 тысяч изданий, представляющих 130 стран. В ближайшем будущем площадка планирует значительно увеличить количество гуманитарных, узкоспециализированных и неанглоязычных журналов. Что интересно, DOAJ предоставляют открытый API для автоматизации поиска по различным параметрам.

Peerus — помогает отслеживать свежие тематические публикации. Каждый день архив пополняется в среднем на 7 тысяч новых материалов. Peerus предоставляет интеграцию с университетскими прокси для загрузки материалов в один клик.

Crossref — открытый архив для публикации и поиска научных работ. Цель проекта — объединить ученых со всего мира на одной площадке, чтобы они могли совместно решать исследовательские задачи. На сайте уже собрали сто миллионов записей. Найти нужный контент можно по метаданным и ключевым словам.

SciRate — веб-приложение для поиска исследований на arXiv.org. Есть фильтры по научным областям и дате публикации. Дополнительно реализована система пользовательских оценок, на базе которой каждой статье присваивается рейтинг.

ArXiv Sanity Preserver — ускоряет поиск по arXiv.org с помощью алгоритмов машинного обучения. На стартовой странице отображаются самые новые материалы вместе с аннотацией. Искать публикации можно по ключевым словам — в поисковой строке, а также по похожим признакам — с помощью ссылки show similar, которая расположена в правом верхнем углу возле каждого документа.

OSF — открытый хаб для поиска и создания научных проектов. Тут можно структурировать исследовательскую работу — наладить контроль за версиями и добавить тэги, чтобы публикацию нашли другие люди. Платформа предполагает работу в облаке, что облегчает доступ к своим проектам. Наработками можно заниматься самостоятельно и делиться с членами сообщества.

Организация и цитирование


doi2bib — поисковой движок для работы со списками источников. В строку поиска вводится цифровой идентификатор объекта (DOI), и система отображает метаданные по найденному материалу для организации списка библиографии в формате BibTeX.

JabRef — приложение, которое оптимизирует работу с библиографическими списками в формате BibTeX. Сгенерированный список экспортируется в HTML, Docbook, BibTeXML, MODS, RTF, Refer/Endnote, OpenOffice и LibreOffice. Запустить утилиту можно на Java VM (версия 8), под Win, Linux и OS X.

Mendeley — менеджер библиографических списков и облачная платформа, которая позволяет получить доступ к файлам по проекту с любого устройства. Mendeley также предлагает рекомендательные возможности и инструменты для общения.

Docear — открытый инструмент для организации источников и построения научной работы на их основе. Пользователю нужно указать папку, которая будет играть роль «библиотеки» материалов по определенному проекту. Программа будет автоматически сканировать ее и добавлять найденные файлы в свою базу данных. Базу данных можно структурировать в виде «дерева», объединяя в одну ветку работы одной направленности. Комментарии и выделения в pdf-файлах автоматически импортируются и также отображаются в интерфейсе. Когда работа с источниками закончится, Docear поможет сформировать итоговый «mind map» и предоставит необходимые цитирования.

Duecredit — цитировать можно не только текст, но и код. Если ваша программа заимствует алгоритмы или методы из научных работ, эта библиотека поможет вам корректно на них сослаться. На данный момент библиотека доступна на Python.

Работа с документами


Sphinx — инструмент для «компиляции» документов в reStructuredText'е в HTML, ePub, Texinfo, man-страницы и plain-text. Поддерживает 50 расширений, автоматическую индексацию программных компонентов, создание ссылок для функций, классов, цитат, терминов и проч. Для новичков разработчики подготовили туториал и гайд для быстрого старта. Дополнительно предлагаем посмотреть следующие темы для работы в Sphinx: rtd — поддерживает как Sphinx, так и Read the Docs; Bootstrap — тема, где CSS-шаблоны и JavaScript-расширения фреймворка Bootstrap интегрировали с функционалом Sphinx: навигацией, иерархическим меню и проч.


Фото freddie marriage — Unsplash

Git-scribe — открытый инструмент, заточенный под создание электронных книг. Предоставляет функционал для структурирования текста, редактуры, вычитки, коррекции, совместной работы, а также публикации и экспорта в PDF, mobi и epub.

Jupyter Notebook — текстовой редактор со встроенной средой для интерактивного программирования на Python. Ранее был известен под именем iPython Notebook. Можно установить как локально, так и на VPS, существуют облачные версии продукта.

Texture — интерфейс этого редактора дает доступ к широкому ряду специализированных функций — таких, как создание графиков, формул и разных способов цитирования. Программа использует специальный файловый формат, который при желании можно «распаковать» и разобрать на составляющие. По словам создателей Texture, это позволяет издателям упростить процесс редактирования и рецензирования.



Что внутри Университета ИТМО:

Комментарии (3)


  1. osmanpasha
    12.06.2019 18:17

    В довесок к jupyter notebook стоит упомянуть jupyter lab — дальнейшее развитие notebook в сторону полноценной ide.


    Ну и, думаю, никакая статья про поиск источников не будет полна без упоминания scihub)


  1. oldbie
    12.06.2019 21:47

    Ожидал увидеть здесь zotero — open-source альтернатива проприетарного mendeley. При этом после мытарств с менделеем под linux не считаю его кроссплатформенным в отличие от zotero(хотя возможно это уже не актуально с новыми версиями).

    upd: последний релиз docear — 2015 год. Вот запись с их страницы загрузки:

    We currently do not have the funding and time to continue the development of Docear, or giving support. This also means that we cannot fix any bugs that might exist in the current version of Docear.

    Вольный перевод: У нас нет ни средств ни времени продолжать разработку или поддержку docear. Это также означает что баги, которые есть в текущей версии docear, не будут исправляться.


    1. koreec
      13.06.2019 03:44

      Хех, с линуксом проблемы… После очередного апгрейда менделея, я потратил неделю, пытаясь запустить менделеевский плагин для Ворда. Безрезультатно. Пришлось переносить всю базу в в SciRef, при этом выяснилось что у менделея свои понятия о том, какую информацию включать в ris-файл, а какая пользователю не нужна. Нам такой менделей не нужен.