Всем привет! Я расскажу и покажу, как сервис для анализа Github и LinkedIn позволил нам отказаться от стандартного процесса “вакансия-резюме”. Недавно в моей компании функцию конкурентного анализа выделили в отдельную команду. 

Руководство этой командой поручили мне. А в команду нужны люди с профильным опытом. В первую очередь, я стал искать  нескольких сильных senior разработчиков, которые могли бы внести значительный вклад в построение нашего сервиса для автоматизированного сбора данных. На эту роль был нужен "разработчик-аналитик", который умеет не только писать код, но и глубоко понимает анализ данных.

Подход 1. Вакансия на HH

Вместе с отделом кадров мы тщательно подготовили описание вакансии и разместили его на HeadHunter. Сначала мы радовались, что откликов на вакансию было много. Однако по мере общения с кандидатами я начал осознавать, что большинство кандидатов - это или очень сильные разработчики, которые никогда не работали в области аналитики, или, наоборот, исключительно профессиональные аналитики без опыта написания кода для продакшена.

Как итог, 36 собеседований и 0 релевантных кандидатов.

Поиск в HeadHunter
Поиск в HeadHunter

Подход 2. Поиск в LinkedIn и чатах в Telegram

Пока я активно искал вакансии на HH, я также начал искать вручную по LinkedIn и различным профессиональным чатам в Telegram. Я просматривал профили и публикации специалистов, у которых был опыт как в разработке, так и в аналитике. Оказалось, что таких специалистов было совсем немного, да еще многие из этих профилей давно не обновлялись или были плохо заполнены.

Кандидаты, которые отвечали на мои письма, в основном уже либо полностью перешли в разработку, либо сосредоточились только на аналитике. 

Еще 13 собеседований и 0 релевантных кандидатов. Идеального кандидата-многостаночника все еще не было.

Поиск релевантных людей в LinkedIn
Поиск релевантных людей в LinkedIn

Подход 3. Собственная платформа Startrix

После трех недель безуспешных попыток я решил создать платформу, сочетающую возможности анализа кода на Github и анализа профиля в LinkedIn. Вполне возможно, что сочетание анализа фреймворков в коде с опытом работы - ключ к поиску идеального кандидата. Наверно, я бы не взялся за этот проект с нуля, но большая часть наработок для этого проекта у меня уже была в виде моего магистерского диплома на кафедре управления технологическими проектами в магистратуре МФТИ, где я доучиваюсь на последнем курсе. Так появился “Проект Startrix”.  

Github предлагает открытое API. С его помощью можно легко извлечь данные пользователей и репозиториев, и получить код из репозиториев. Сбор данных из LinkedIn сложнее, но мне помогла библиотека.

В итоге весной 2024 года я запустил пока для себя Startrix, который одновременно делает анализ кода на Github и анализ профиля в LinkedIn. Startrix собирает и анализирует все фреймворки, языки программирования и навыки кандидата. Для этого Startrix шерстит каждый файл с кодом каждого репозитория потенциальных кандидатов. C LinkedIn собирается информация об опыте работы, образовании, локации и навыках.

И вот с этого момента началась настоящая, полноценная «охота за талантами». С такой информацией резюме оказалось совершенно не нужно - достаточно создать рейтинг специалистов по запросу опыта и навыков. 

Платформа Startrix
Платформа Startrix

Я поставил фильтры на сферу деятельности (backend development и analytics) и на навыки (python). На выходе остались около 40 человек, соответствующих этим критериям, причем у всех были прямые контакты. Это были либо профили в LinkedIn, либо ссылки на их репозитории на Github. Кандидаты отсортированы по количеству "звезд", которые получили их репозитории от других пользователей, и по количеству коммитов за последние два года. Это лучшая доступная метрика активности и профессионализма, которую можно создать по имеющимся данным. 

В итоге после поиска в этом суженном до предела списке мы провели всего четыре собеседования. Тот самый идеальный кандидат нашелся уже на втором интервью. Этот кандидат был как будто скрыт от общественного взора - его не было на радарах в LinkedIn, он не искал работу на HH. Однако его увлечение и страсть к своему делу были очевидны - он регулярно выкладывал свои пет-проекты на Github. Он разрабатывал платформу автоматического сбора данных, где умело применял свои навыки и разработки, и дата-инжиниринга, и дата-аналитика. Один из его проектов - это регулярный сбор данных с Amazon с настроенным процессом Data Quality, алертингом в телеграм с инсайтами по резкому изменению цены определенных товаров и дашбордизацией в open-source BI инструменте Metabase. По проекту было ясно, что автор умеет работать с большими данными и применять инструменты для их анализа.

После того, как Startrix вынес его на поверхность, мы потратили всего две недели от письма с предложением вакансии до финального оффера. 

После этого мы нашли и наняли с помощью Startrix еще двух разработчиков. 

Поскольку моя команда полностью укомплектована - можете тоже поюзать Startrix, он себя отлично проявил. Или просто поищите там себя - где алгоритм найдет вас и на какое место поднимет. И пишите свои советы и замечания - хотя это тоже пока мой пет-проект, я хочу его доработать до прода. Заранее большое спасибо всем за тест-драйв и за советы! 

Комментарии (3)


  1. OBIEESupport
    17.06.2024 13:05
    +4

    В целом подход понятен. А что у вас вкладывается в "использование API GitHub", кроме определения числа строк кода того или иного кандидата и предсказания числа использованных технологий?


    1. BogdanSemenov Автор
      17.06.2024 13:05

      По сути, с помощью API делаем полный обход репозиториев и юзеров. Сбор информации о коммитах и звездочках. Собираем данные из readme.

      Дальше уже просто парсинг самих файлов с кодом без использования API.


  1. gun_dose
    17.06.2024 13:05
    +3

    Вам повезло, что удалось найти кандидата, чей опыт можно отследить по Github. В реальности же у большинства разработчиков на гитхабе будет написано "100500 contributions in private repositories".