Интересные научные проекты часто реализуются на стыке нескольких областей. В последнее время такие проекты становятся краткосрочными, а, значит, все сложнее искать людей, совмещающих нужные компетенции.

Специалисты из Национального центра когнитивных разработок на базе ИТМО задумались о том, как снизить риски найма через оценку открытой информации о человеке и анализ видеозаписи его интервью. Предложенный ими инструмент Exclusive подбирает специалистов по их цифровому следу, подсказывает вопросы для собеседования и анализирует личностные качества и поведение кандидата, помогая принять решение о приглашении в команду.

В этой статье поговорим о том, что у сервиса под капотом: какую полезную информацию можно собрать из открытых источников и записи интервью, а также как ее можно использовать для снижения проектных рисков. 

На Хабре много обсуждается наем в IT. Когда речь заходит об ускорении процесса, все помнят, что есть испытательный срок, во время которого можно ввести человека в курс дела и одновременно присмотреться к его личностным качествам. Но в краткосрочных междисциплинарных научных проектах времени на все это нет. Здесь не приходится рассчитывать и на базу резюме готовых специалистов, которые ходят по собеседованиям, просто чтобы понимать свою рыночную цену.

Так как искать таких людей?

В двух словах о задаче

Исследования, научные проекты и разработка интеллектуальных продуктов становятся всё быстрее. При этом глубину и качество их проработки никто не отменял. В IT-стартапах часто используется более простой подход — специалисты из одной предметной области (предположим, data scientist-ы) читают несколько статей по смежной дисциплине и полностью доверяются им по части компетенций. Но в научном мире работа ведется иначе. Если разработке необходимы какие-то выкладки из области психологии, значит, нужен дипломированный специалист, который проанализирует знания в нужной области и представит мотивированное мнение с учетом всех условий. Таким образом, для междисциплинарных научных проектов необходимы специалисты со знаниями сразу из нескольких областей. Например, data scientist с публикациями по психологии или юриспруденции. Или backend-разработчик, окончивший курсы по медицинской рентгенографии. 

Как правило, такие люди не ищут вакансии — их всё устраивает там, где они уже работают, а если они и переходят с места на место, то по рекомендациям. Их резюме практически невозможно найти на сайтах вроде HeadHunter. 

И даже если каким-то образом удается найти нужного специалиста, риски неправильного выбора кандидата всегда велики. Если проект длится всего четыре месяца, а через два он просто уйдет, не закончив начатое, времени на наем следующего человека уже не будет — проект с высокой вероятностью не удастся реализовать в срок.

В ИТМО придумали, как снизить эти риски, используя открытые данные о кандидате из интернета и результаты его собеседования в форме онлайн-интервью. Идея легла в основу сервиса Exclusive, для создания которого в Национальном центре когнитивных разработок Университета ИТМО была собрана проектная команда. 

Суть проекта

Грамотные специалисты в науке оставляют явно выраженный цифровой след — они публикуются, выступают на конференциях, упоминаются на сайтах научных организаций, в которых работают. Именно по этому следу специалисты ИТМО и предлагают их искать и оценивать благонадежность.

Сервис Exclusive выполняет поиск, подбор и ранжирование кандидатов за несколько шагов. Пройдемся по каждому из них.

Формирование запроса для поиска

Поиск специалиста начинается с выявления артефактов предметной области. В единственную поисковую строку сервиса необходимо ввести профессию, названия ролей и/или ключевые слова, связанные с тематикой проекта, допустим “искусственный интеллект, data scientist, психолог”.

Сервис расширяет этот запрос до облака тегов, по которым и будут формироваться запросы, переводит их  на английский язык и запускает поиск публикаций, изобретений и сведений о грантах сразу в нескольких источниках: eLibrary, Scopus, ФИПС, РНФ.

Облако тегов в ответ на запрос:" искусственный интеллект, data scientist, психолог"
Облако тегов в ответ на запрос:" искусственный интеллект, data scientist, психолог"

Добавление кандидатов в список

На основе результатов поиска в наукометрических базах, базах Роспатента и РНФ выявляются авторы, релевантные сформированному запросу, и строится сеть соавторства, которая позволяет понять, случайно человек поучаствовал в проекте по данной тематике (например, указан соавтором работы по психологии, при том, что он математик) или же он планомерно развивался в данном направлении.

Сеть соавторства помогает добавить в список кандидатов тех, кто действительно оставил след в исследованиях в требуемых предметных областях.

Заполнение цифровых профилей кандидатов 

Из библиотек публикаций, их метаданных и связанных с ними ресурсов можно получить много полезной информации:

  • фамилии, имена и отчества авторов,

  • их контакты,

  • место работы, связи с научными учреждениями,

  • количество патентов и грантов,

  • наукометрические показатели: h-индекс и количество цитирований.

Для кандидатов, попавших в первоначальный список, сервис агрегирует все эти данные и сохраняет в их цифровые профили.

Связи автора с научными учреждениями можно использовать для поиска открытых данных на сайтах НИИ или ВУЗа, где он работает. Как правило, там можно обнаружить графические материалы и с помощью простейшей модели распознавания лиц добавить в профиль фотографию. Обычно также находится номер телефона (не всегда личный, обычно — кафедральный) и адрес электронной почты.

Имя и дату рождения можно использовать для поиска профилей кандидатов в социальных сетях. Еще совсем недавно команда работала над модулем, который находит профили в разных соцсетях и сверяет указанные там данные, подсвечивая несоответствия. Но сейчас поиск доступен только по ВКонтакте, поэтому выявление разночтений потеряло смысл. Зато из соцсети можно извлечь личную информацию — семейное положение, круг общения и т.п. Все эти данные попадают в профиль.

Онлайн-интервью

В зависимости от того, какие данные в цифровом профиле кандидата остаются незаполненными на предыдущем шаге, сервис автоматически генерирует вопросы для онлайн-интервью. Интерфейс Exclusive позволяет отредактировать этот список и отправить его кандидату вместе с предварительным оффером и ссылкой для прохождения собеседования.

Если оффер вызвал интерес, задача кандидата — сесть в спокойной обстановке перед веб-камерой и ответить на вопросы. Сервис же переводит полученные ответы в текст и дополняет цифровой профиль, если оценивает соответствующие ответы как истину. За это отвечает модуль цифрового профайлинга, разработанный сотрудниками НЦКР. Он анализирует невербальные параметры акустического и визуального каналов в записи интервью и определяет уверенность ответов кандидатов.

Сформированный цифровой профиль отражает “профессиограмму” человека, показывающую его научный вклад в требуемую предметную область и науку в целом, а также её основные показатели.

Благонадежность как фактор снижения рисков

Отличительная особенность инструмента, которая и помогает снизить риски найма для краткосрочных научных проектов, — это оценка так называемой благонадежности—комплексного параметра, включающего сразу несколько частных показателей —агрессивность, негативные зависимости (склонность к азартным играм, употреблению наркотических веществ и алкоголя) и отношение к нравственным ценностям, лживость и участие в финансовых махинациях.

Данные для оценки благонадежности кандидата собираются на всех этапах поиска информации. Например, в постах в социальных сетях выявляются ключевые слова, характеризующие отношение к реальности — под это совместно с психологом были собраны несколько словарей с нужными формулировками. Дополнительные данные — это сообщества и список друзей, из которых можно выявить сомнительные контакты (например, участие в экстремистских сообществах, сектах и т.п.). Также оценивается круг общения в целом — насколько он отличается от “среднестатистических” показателей обычных пользователей и как быстро меняется.

Много информации для оценки благонадежности дает онлайн-интервью. Помимо автоматически сгенерированных вопросов,  в него добавляются специальные вопросы, подобранные психологом. 

Аудиовидеозапись интервью обрабатывается модулем цифрового профайлинга —запатентованным решением одной из задач докторской диссертации руководителя проекта Exclusive и научно-исследовательской лаборатории «Когнитивная невербалика» Национального центра когнитивных разработок ИТМО Олега Басова. Модуль цифрового профайлинга разбивает запись интервью на отрезки по 10 секунд. В каждом отрезке с помощью сверточной нейронной сети детектируется лицо человека и рассчитывается вектор признаков лица. Далее выделяется 478 лицевых ориентиров, позволяющих построить вектор мимики и оценить его изменения. Отдельно извлекается и обрабатывается аудиопоток, из которого выделяются паузы, амплитудные и частотные колебания голоса.

Все выявленные признаки отправляются в модель TimeSformer, которая на выходе выдает ответ — лгал ли человек в эти 10 секунд или говорил правду. Данные в профиль кандидата из ответов его онлайн-интервью записываются только в том случае, если он был уверен в своем ответе.

Обучалась модель по 1742 предзаписанным интервью студентов с общими и личными вопросами (в общей сложности около 46 тыс. секунд видео), где они контролируемо лгали или говорили правду. Итоговая точность модели составила 83%.

Все частные показатели благонадежности линейно сворачиваются в единую оценку с разными весами, которые работодатель может установить вручную для каждой интересующей его должности при настройке сервиса. Например, если на какой-то работе не важно отношение к нравственным ценностям, вес этого показателя можно снизить до 0. Так появляется возможность сравнивать личностные качества кандидатов, используя единую шкалу.

Ранжирование кандидатов

Результат работы сервиса — список кандидатов, который ранжируется в соответствии с тем, насколько рассчитанные параметры важны для работодателя, а также насколько кандидат подходит по своим компетенциям для выполнения краткосрочного проекта.

Существующую реализацию сервиса можно дополнить модулем назначения ролей. С учетом уже собранной информации о кандидате этот модуль просто добавит несколько вопросов в онлайн-интервью, чтобы выделить предпочтительные роли среди исполнителей научного проекта или в продуктовой команде. Так можно сформировать эффективную команду с учетом профессиональных, в том числе междисциплинарных, компетенций, ролей и межличностной совместимости.

Этот модуль сейчас проходит “обкатку” внутри ИТМО. Для этого были сформированы несколько студенческих команд (часть — по рекомендациям модуля, часть — самостоятельно). Результаты можно будет оценить в конце июня. Если модуль покажет свою эффективность, при ранжировании общего списка кандидатов можно будет учитывать и его результаты.

Подходящего человека можно пригласить на дополнительные интервью или выслать финальный оффер и начинать процедуру трудоустройства. Кстати, сервис не видит разницы между поиском специалиста на удаленку или с релокацией, поскольку работает дистанционно.

Что под капотом

Под капотом инструмента микросервисная архитектура в контейнерах Docker. 

Сервис реализован на Python 3.8 и 3.9 - на фреймворке FastAPI. Разные версии появились из-за того, что микросервисы писались постепенно одновременно с обновлением языка. Перейдя на 3.9, команда просто не стала переписывать уже готовые микросервисы.

Для парсинга сайтов используется библиотека Beautiful Soup, а в особо сложных случаях для скачивания html — Selenium. В качестве СУБД применяется MySQL 8 и инструмент Adminer, который представляет собой простой веб-интерфейс для БД.

Сервис находится на этапе открытого тестирования. О результатах тестирования можно будет говорить, когда закончатся первые проекты, участники которых проходили отбор с помощью Exclusive. 

Перспективы проекта

В целом, из существующего набора модулей можно собрать много интересных сервисов, вопрос лишь в том, под кого нужно будет создавать следующий MVP.

В изначальной концепции команда предполагала сделать сервис-помощник для видеопереговоров. При подготовке к встрече он должен автоматически собирать и анализировать информацию о собеседнике из открытых источников. А во время беседы считывать невербальные сигналы, анализировать эмоции и подсказывать, какую стратегию переговоров лучше выбрать. Для MVP эта идея оказалась слишком масштабной, но не исключено, что инструмент сможет развиваться именно в этом направлении.

В целом подход с поиском кандидатов по их цифровому следу потенциально применим и в IT — есть Хабр, Medium, Github и другие ресурсы, где люди оставляют свои знания. Сейчас при поиске редких ИТ-специалистов от middle и выше некоторые уже применяют такие техники. Вероятно, эта идея может тиражироваться и на другие сферы деятельности, где есть смысл говорить о цифровых следах — например, медицину или юриспруденцию.

В свою очередь командой научно-исследовательской лаборатории «Когнитивная невербалика» в новом проекте создается MVP, позволяющий оценить состоятельность экспертного мнения кандидата, отобранного с помощью сервиса Exclusive. Проект выполняется в рамках программы развития Университета ИТМО на 2021-2030 годы и получил условное название “Эксперт”. 

Если вы заинтересовались сервисом и хотели бы принять участие в тестировании, свяжитесь с командой проекта — оставьте заявку на сайте

Комментарии (6)


  1. Areso
    21.06.2022 20:01
    +4

    Так у вас или эксклюзивный поиск уникальных кандидатов, или отфильтровка тех, кто после графика 6*12 имеет склонность к суициду.

    Вы там или трусы или крестик, пожалуйста.


    1. Dr_Dash
      22.06.2022 01:58
      +3

      Поиск благонадёжных. Это запугивание нас всех.Типа контакты подотри, с сомнительными не дружи. Предлагаю всему IT сообществу обратить на это внимание и как то противодействоаать. Это не "эксперт" а борьба с инакомыслием


  1. iingvaar
    21.06.2022 20:24
    +3

    Проверялась ли гипотеза о том, что такие люди существуют?


  1. Anton_Menshov
    22.06.2022 00:09
    +7

    Если будете включать меня в индекс, пожалуйста, сразу же выставьте максимальную неблагонадежность. Ибо вы просто адище придумали.


  1. buratino
    22.06.2022 10:37

    Исследования, научные проекты и разработка интеллектуальных продуктов становятся всё быстрее. При этом глубину и качество их проработки никто не отменял.

    вас прямо хоть в тиливизире показывать...

    Сеть соавторства помогает добавить в список кандидатов тех, кто действительно оставил след в исследованиях в требуемых предметных областях.

    как говорится - угадайте с первого раза кто попадет в первые ряды кандидатов....

    Но сейчас поиск доступен только по ВКонтакте,

    дискриминация Одноглазников?

    Отличительная особенность инструмента, которая и помогает снизить риски найма для краткосрочных научных проектов,

    Краткосрочные научные проекты - это что-то типа краткосрочных контрактов в военкоматах?


    1. Areso
      22.06.2022 14:36
      +1

      Именно против таких, не в меру любопытных рекрутеров, и надо держать профиль в соцсетях непубличным.