Институт искусственного интеллекта Пола Аллена (Allen Institute for Artificial Intelligence, AI2), созданный одним из основателей Microsoft Полом Алленом, объявил о запуске поисковой машины Semantic Scholar, которая ориентирована на «умный поиск» в научных статьях. Пока что проект имеет статус беты и база данных документов содержит тексты только из области компьютерных наук. Основным отличием от конкурента Google Scholar заявлена возможность «семантического понимания», под которой имеется ввиду, что система может извлекать из статьи характерные элементы — ссылки, цитаты, ключевые фразы — и помогать пользователю ориентироваться в них.

Поисковая машина имеет типичный интерфейс, включая умные подсказки с именами авторов, доступными пока что только на английском языке. Поисковые результаты выглядят как список заголовков статей аннотаций к ним; в левой части доступны инструменты для анализа результатов. Помимо достаточно стандартных для такого рода поиска данных, таких как даты публикации или издательство, интересным выглядит блок «Key Phrase», который группирует «ключевые фразы», встречающиеся для предмета поиска в найденных статьях. При клике на ключевую фразу система показывает документы, где она, по мнению системы, играет ключевую роль. Найденные статьи свободно доступны в формате pdf.

image

Если попробовать перейти по какой-либо найденной ссылке, то система показывает список источников, использованных в документе. Они по умолчанию упорядочены в соответствии со степенью их «влияния» на текст. За определение степени «влияния» отвечает специальный алгоритм, работу которого в своей статье описал CEO AI2 Орен Эциони (Oren Etzioni). Соседняя кнопка показывает краткие выдержки из текста в виде всплывающих подсказок.

image

Пока что базы данных документов даже по компьютерным наукам у Semantic Scholar и Google Scholar несравнимы по количеству текстов: поиск по слову «java» в системе Google даёт 2 060 000 результатов, тогда как у новой системы результаты гораздо скромнее — 89 928 документов.

Комментарии (2)


  1. ivlis
    02.11.2015 23:16
    +1

    И чем это лучше ieeexplore.ieee.org?


  1. excoder
    05.11.2015 00:16

    Да в общем сложно сегодня зацепить кого-то «семантическим» и «пониманием смысла». Сейчас это принято именовать «когнитивным». Но тут всё равно прорывная новизна не ощущается никак. Не хватает чего-то в подаче таких технологий. Сумма предлагаемых частей меньше желаемого целого.