Интересные научные проекты часто реализуются на стыке нескольких областей. В последнее время такие проекты становятся краткосрочными, а, значит, все сложнее искать людей, совмещающих нужные компетенции.
Специалисты из Национального центра когнитивных разработок на базе ИТМО задумались о том, как снизить риски найма через оценку открытой информации о человеке и анализ видеозаписи его интервью. Предложенный ими инструмент Exclusive подбирает специалистов по их цифровому следу, подсказывает вопросы для собеседования и анализирует личностные качества и поведение кандидата, помогая принять решение о приглашении в команду.
В этой статье поговорим о том, что у сервиса под капотом: какую полезную информацию можно собрать из открытых источников и записи интервью, а также как ее можно использовать для снижения проектных рисков.
На Хабре много обсуждается наем в IT. Когда речь заходит об ускорении процесса, все помнят, что есть испытательный срок, во время которого можно ввести человека в курс дела и одновременно присмотреться к его личностным качествам. Но в краткосрочных междисциплинарных научных проектах времени на все это нет. Здесь не приходится рассчитывать и на базу резюме готовых специалистов, которые ходят по собеседованиям, просто чтобы понимать свою рыночную цену.
Так как искать таких людей?
В двух словах о задаче
Исследования, научные проекты и разработка интеллектуальных продуктов становятся всё быстрее. При этом глубину и качество их проработки никто не отменял. В IT-стартапах часто используется более простой подход — специалисты из одной предметной области (предположим, data scientist-ы) читают несколько статей по смежной дисциплине и полностью доверяются им по части компетенций. Но в научном мире работа ведется иначе. Если разработке необходимы какие-то выкладки из области психологии, значит, нужен дипломированный специалист, который проанализирует знания в нужной области и представит мотивированное мнение с учетом всех условий. Таким образом, для междисциплинарных научных проектов необходимы специалисты со знаниями сразу из нескольких областей. Например, data scientist с публикациями по психологии или юриспруденции. Или backend-разработчик, окончивший курсы по медицинской рентгенографии.
Как правило, такие люди не ищут вакансии — их всё устраивает там, где они уже работают, а если они и переходят с места на место, то по рекомендациям. Их резюме практически невозможно найти на сайтах вроде HeadHunter.
И даже если каким-то образом удается найти нужного специалиста, риски неправильного выбора кандидата всегда велики. Если проект длится всего четыре месяца, а через два он просто уйдет, не закончив начатое, времени на наем следующего человека уже не будет — проект с высокой вероятностью не удастся реализовать в срок.
В ИТМО придумали, как снизить эти риски, используя открытые данные о кандидате из интернета и результаты его собеседования в форме онлайн-интервью. Идея легла в основу сервиса Exclusive, для создания которого в Национальном центре когнитивных разработок Университета ИТМО была собрана проектная команда.
Суть проекта
Грамотные специалисты в науке оставляют явно выраженный цифровой след — они публикуются, выступают на конференциях, упоминаются на сайтах научных организаций, в которых работают. Именно по этому следу специалисты ИТМО и предлагают их искать и оценивать благонадежность.
Сервис Exclusive выполняет поиск, подбор и ранжирование кандидатов за несколько шагов. Пройдемся по каждому из них.
Формирование запроса для поиска
Поиск специалиста начинается с выявления артефактов предметной области. В единственную поисковую строку сервиса необходимо ввести профессию, названия ролей и/или ключевые слова, связанные с тематикой проекта, допустим “искусственный интеллект, data scientist, психолог”.
Сервис расширяет этот запрос до облака тегов, по которым и будут формироваться запросы, переводит их на английский язык и запускает поиск публикаций, изобретений и сведений о грантах сразу в нескольких источниках: eLibrary, Scopus, ФИПС, РНФ.
Добавление кандидатов в список
На основе результатов поиска в наукометрических базах, базах Роспатента и РНФ выявляются авторы, релевантные сформированному запросу, и строится сеть соавторства, которая позволяет понять, случайно человек поучаствовал в проекте по данной тематике (например, указан соавтором работы по психологии, при том, что он математик) или же он планомерно развивался в данном направлении.
Сеть соавторства помогает добавить в список кандидатов тех, кто действительно оставил след в исследованиях в требуемых предметных областях.
Заполнение цифровых профилей кандидатов
Из библиотек публикаций, их метаданных и связанных с ними ресурсов можно получить много полезной информации:
фамилии, имена и отчества авторов,
их контакты,
место работы, связи с научными учреждениями,
количество патентов и грантов,
наукометрические показатели: h-индекс и количество цитирований.
Для кандидатов, попавших в первоначальный список, сервис агрегирует все эти данные и сохраняет в их цифровые профили.
Связи автора с научными учреждениями можно использовать для поиска открытых данных на сайтах НИИ или ВУЗа, где он работает. Как правило, там можно обнаружить графические материалы и с помощью простейшей модели распознавания лиц добавить в профиль фотографию. Обычно также находится номер телефона (не всегда личный, обычно — кафедральный) и адрес электронной почты.
Имя и дату рождения можно использовать для поиска профилей кандидатов в социальных сетях. Еще совсем недавно команда работала над модулем, который находит профили в разных соцсетях и сверяет указанные там данные, подсвечивая несоответствия. Но сейчас поиск доступен только по ВКонтакте, поэтому выявление разночтений потеряло смысл. Зато из соцсети можно извлечь личную информацию — семейное положение, круг общения и т.п. Все эти данные попадают в профиль.
Онлайн-интервью
В зависимости от того, какие данные в цифровом профиле кандидата остаются незаполненными на предыдущем шаге, сервис автоматически генерирует вопросы для онлайн-интервью. Интерфейс Exclusive позволяет отредактировать этот список и отправить его кандидату вместе с предварительным оффером и ссылкой для прохождения собеседования.
Если оффер вызвал интерес, задача кандидата — сесть в спокойной обстановке перед веб-камерой и ответить на вопросы. Сервис же переводит полученные ответы в текст и дополняет цифровой профиль, если оценивает соответствующие ответы как истину. За это отвечает модуль цифрового профайлинга, разработанный сотрудниками НЦКР. Он анализирует невербальные параметры акустического и визуального каналов в записи интервью и определяет уверенность ответов кандидатов.
Сформированный цифровой профиль отражает “профессиограмму” человека, показывающую его научный вклад в требуемую предметную область и науку в целом, а также её основные показатели.
Благонадежность как фактор снижения рисков
Отличительная особенность инструмента, которая и помогает снизить риски найма для краткосрочных научных проектов, — это оценка так называемой благонадежности—комплексного параметра, включающего сразу несколько частных показателей —агрессивность, негативные зависимости (склонность к азартным играм, употреблению наркотических веществ и алкоголя) и отношение к нравственным ценностям, лживость и участие в финансовых махинациях.
Данные для оценки благонадежности кандидата собираются на всех этапах поиска информации. Например, в постах в социальных сетях выявляются ключевые слова, характеризующие отношение к реальности — под это совместно с психологом были собраны несколько словарей с нужными формулировками. Дополнительные данные — это сообщества и список друзей, из которых можно выявить сомнительные контакты (например, участие в экстремистских сообществах, сектах и т.п.). Также оценивается круг общения в целом — насколько он отличается от “среднестатистических” показателей обычных пользователей и как быстро меняется.
Много информации для оценки благонадежности дает онлайн-интервью. Помимо автоматически сгенерированных вопросов, в него добавляются специальные вопросы, подобранные психологом.
Аудиовидеозапись интервью обрабатывается модулем цифрового профайлинга —запатентованным решением одной из задач докторской диссертации руководителя проекта Exclusive и научно-исследовательской лаборатории «Когнитивная невербалика» Национального центра когнитивных разработок ИТМО Олега Басова. Модуль цифрового профайлинга разбивает запись интервью на отрезки по 10 секунд. В каждом отрезке с помощью сверточной нейронной сети детектируется лицо человека и рассчитывается вектор признаков лица. Далее выделяется 478 лицевых ориентиров, позволяющих построить вектор мимики и оценить его изменения. Отдельно извлекается и обрабатывается аудиопоток, из которого выделяются паузы, амплитудные и частотные колебания голоса.
Все выявленные признаки отправляются в модель TimeSformer, которая на выходе выдает ответ — лгал ли человек в эти 10 секунд или говорил правду. Данные в профиль кандидата из ответов его онлайн-интервью записываются только в том случае, если он был уверен в своем ответе.
Обучалась модель по 1742 предзаписанным интервью студентов с общими и личными вопросами (в общей сложности около 46 тыс. секунд видео), где они контролируемо лгали или говорили правду. Итоговая точность модели составила 83%.
Все частные показатели благонадежности линейно сворачиваются в единую оценку с разными весами, которые работодатель может установить вручную для каждой интересующей его должности при настройке сервиса. Например, если на какой-то работе не важно отношение к нравственным ценностям, вес этого показателя можно снизить до 0. Так появляется возможность сравнивать личностные качества кандидатов, используя единую шкалу.
Ранжирование кандидатов
Результат работы сервиса — список кандидатов, который ранжируется в соответствии с тем, насколько рассчитанные параметры важны для работодателя, а также насколько кандидат подходит по своим компетенциям для выполнения краткосрочного проекта.
Существующую реализацию сервиса можно дополнить модулем назначения ролей. С учетом уже собранной информации о кандидате этот модуль просто добавит несколько вопросов в онлайн-интервью, чтобы выделить предпочтительные роли среди исполнителей научного проекта или в продуктовой команде. Так можно сформировать эффективную команду с учетом профессиональных, в том числе междисциплинарных, компетенций, ролей и межличностной совместимости.
Этот модуль сейчас проходит “обкатку” внутри ИТМО. Для этого были сформированы несколько студенческих команд (часть — по рекомендациям модуля, часть — самостоятельно). Результаты можно будет оценить в конце июня. Если модуль покажет свою эффективность, при ранжировании общего списка кандидатов можно будет учитывать и его результаты.
Подходящего человека можно пригласить на дополнительные интервью или выслать финальный оффер и начинать процедуру трудоустройства. Кстати, сервис не видит разницы между поиском специалиста на удаленку или с релокацией, поскольку работает дистанционно.
Что под капотом
Под капотом инструмента микросервисная архитектура в контейнерах Docker.
Сервис реализован на Python 3.8 и 3.9 - на фреймворке FastAPI. Разные версии появились из-за того, что микросервисы писались постепенно одновременно с обновлением языка. Перейдя на 3.9, команда просто не стала переписывать уже готовые микросервисы.
Для парсинга сайтов используется библиотека Beautiful Soup, а в особо сложных случаях для скачивания html — Selenium. В качестве СУБД применяется MySQL 8 и инструмент Adminer, который представляет собой простой веб-интерфейс для БД.
Сервис находится на этапе открытого тестирования. О результатах тестирования можно будет говорить, когда закончатся первые проекты, участники которых проходили отбор с помощью Exclusive.
Перспективы проекта
В целом, из существующего набора модулей можно собрать много интересных сервисов, вопрос лишь в том, под кого нужно будет создавать следующий MVP.
В изначальной концепции команда предполагала сделать сервис-помощник для видеопереговоров. При подготовке к встрече он должен автоматически собирать и анализировать информацию о собеседнике из открытых источников. А во время беседы считывать невербальные сигналы, анализировать эмоции и подсказывать, какую стратегию переговоров лучше выбрать. Для MVP эта идея оказалась слишком масштабной, но не исключено, что инструмент сможет развиваться именно в этом направлении.
В целом подход с поиском кандидатов по их цифровому следу потенциально применим и в IT — есть Хабр, Medium, Github и другие ресурсы, где люди оставляют свои знания. Сейчас при поиске редких ИТ-специалистов от middle и выше некоторые уже применяют такие техники. Вероятно, эта идея может тиражироваться и на другие сферы деятельности, где есть смысл говорить о цифровых следах — например, медицину или юриспруденцию.
В свою очередь командой научно-исследовательской лаборатории «Когнитивная невербалика» в новом проекте создается MVP, позволяющий оценить состоятельность экспертного мнения кандидата, отобранного с помощью сервиса Exclusive. Проект выполняется в рамках программы развития Университета ИТМО на 2021-2030 годы и получил условное название “Эксперт”.
Если вы заинтересовались сервисом и хотели бы принять участие в тестировании, свяжитесь с командой проекта — оставьте заявку на сайте.
Комментарии (6)
Anton_Menshov
22.06.2022 00:09+7Если будете включать меня в индекс, пожалуйста, сразу же выставьте максимальную неблагонадежность. Ибо вы просто адище придумали.
buratino
22.06.2022 10:37Исследования, научные проекты и разработка интеллектуальных продуктов становятся всё быстрее. При этом глубину и качество их проработки никто не отменял.
вас прямо хоть в тиливизире показывать...
Сеть соавторства помогает добавить в список кандидатов тех, кто действительно оставил след в исследованиях в требуемых предметных областях.
как говорится - угадайте с первого раза кто попадет в первые ряды кандидатов....
Но сейчас поиск доступен только по ВКонтакте,
дискриминация Одноглазников?
Отличительная особенность инструмента, которая и помогает снизить риски найма для краткосрочных научных проектов,
Краткосрочные научные проекты - это что-то типа краткосрочных контрактов в военкоматах?
Areso
22.06.2022 14:36+1Именно против таких, не в меру любопытных рекрутеров, и надо держать профиль в соцсетях непубличным.
Areso
Так у вас или эксклюзивный поиск уникальных кандидатов, или отфильтровка тех, кто после графика 6*12 имеет склонность к суициду.
Вы там или трусы или крестик, пожалуйста.
Dr_Dash
Поиск благонадёжных. Это запугивание нас всех.Типа контакты подотри, с сомнительными не дружи. Предлагаю всему IT сообществу обратить на это внимание и как то противодействоаать. Это не "эксперт" а борьба с инакомыслием