Привет, Хабр! Я проанализировал 600 публичных мок-интервью с YouTube и собрал из них 10 000 уникальных вопросов. Затем посчитал, как часто они встречаются, и определил вероятность появления каждого вопроса. У меня есть данные по 20 профессиям, включая frontend, python, java-разработчика, специалиста по тестированию и многих других.

Ниже на изображении представлены первые 15 вопросов для python-разработчика. Всего в моей базе 1100 вопросов для этой специальности.

Проблема

Это исследование для меня, началось с того, что я в попытке подготовиться к предстоящим тех. собесам начал собирать базу вопросов для python-разработчика. Я открывал ролики на YouTube и выписывал в Notion вопросы, а также ответы к ним.

В итоге у меня накопилось около 500 вопросов. Следующим этапом было их повторение: для этого я загрузил все вопросы в Anki и приступил к их изучению методом интервальных повторений. ???? Поймите правильно, я не пытался их заучить втупую, мне хотелось поупражняться, симулировать собеседование.

Однако в процессе стало понятно, что попытка детально изучить все 500 вопросов потребует огромного количества времени. Возможно, это помогло бы мне успешно пройти собеседование, но цена этого успеха казалась слишком высокой. Я хотел определить топ 100-200 наиболее популярных вопросов, чтобы сфокусироваться на них и не тратить время на редкие.

Но как понять, какие вопросы более популярные?

Будучи начинающим разработчиком и осознавая необходимость в практике и пет-проекте для портфолио, я решил провести анализ этих данных и разместить результаты на созданном мной сайте.

Я разбил работу на несколько этапов.

  1. Поиск и сбор публичных интервью на YouTube.

  2. Сбор вопросов из видео.

  3. Сортировка вопросов.

  4. Оценка вероятности появления каждого вопроса.

Поиск и сбор публичных интервью на YouTube

Первый этап, хоть и казавшийся простым, играл ключевую роль. Количество собранных видео напрямую влияло на всю последующую работу: меньше видео — меньше вопросов. Цель была максимально исчерпать ресурс YouTube. В итоге было найдено 630 видео.

Сбор вопросов из видео

Наибольшей сложностью здесь стало то, что интервью ведут живые люди. Они используют повседневный язык, задают несколько вопросов за раз, иногда формулируют их нечетко или говорят невнятно. Бывает, что контекст вопроса узок, а некоторые даже в публичных интервью не стеснялись издеваться: "Ну и что? Теперь считаешь себя джуном?"

Хотя такую задачу и можно было бы автоматизировать, я решил обработать все вопросы вручную из-за множества нюансов. Некоторые вопросы требовали переформулировки, некоторые — разбиения на несколько, а иногда и вовсе отсеивания. Примерно 95% вопросов требовали человеческого вмешательства. Плюсом ко всему я собирал ссылки на тайм-коды, чтобы собрать дополнительно видео-ответы.

В конечном итоге, я сформулировал техническое задание из 15 пунктов по обработке вопросов и разделил работу между фрилансерами. Это позволило быстро и экономно завершить сбор.

Результатом сбора вопросов, стали списки вопросов и ссылок с собеседований

Сортировка вопросов

Как я упоминал ранее, один и тот же вопрос может быть сформулирован по-разному. К тому же, среди собранных вопросов были повторения. Задачей стало определение уникальных вопросов и группировка их различных формулировок.

Оценка вероятности появления каждого вопроса.

Первоначально я рассматривал идею составления топа-100 вопросов, однако это оказалось неудачным решением, так как этот список не отражал реальной картины. Ведь как часто вопрос, занимающий 5-е место, задают по сравнению с вопросом на 50-ом месте? А может, на 77-ом месте одновременно находятся несколько вопросов?

Мне понадобился показатель, который бы четко отражал значимость вопроса. Первая мысль — указать частоту встречаемости каждого вопроса. Но что означает частота — 40 раз? Это много или мало? Я решил, что лучше всего было бы представить эту информацию в виде процентной вероятности. Вопрос "Расскажи о себе" задается почти на 100% технических интервью, и это актуально для любой профессии. Он стал эталоном для расчета вероятности всех остальных.

Результаты исследования доступны на сайте easyoffer.ru. Приглашаю вас ознакомиться! А я, завершив этот пет-проект, начинаю активно искать работу и жду вас в моем телеграм-канале Идущий к IT.

Комментарии (17)


  1. mksmvnv
    24.10.2023 12:28

    Топ. Жду новые статейки, вдохновляюще)


  1. dprotopopov
    24.10.2023 12:28

    Круто! А сколько личного времени ушло на сбор информации?


    1. AlexAgree Автор
      24.10.2023 12:28

      Часов 30 на менеджмент фрилансеров ушло точно.


  1. McKinseyBA
    24.10.2023 12:28

    Результаты исследования доступны на сайте easyoffer.ru.

    Я искать не умею или там нет результатов, а только вопросы?)

    В любом случае - удачи! Хороший pet project


    1. AlexAgree Автор
      24.10.2023 12:28

      Спасибо!)
      Результаты это и есть вопросы + вероятность) Хотя на некоторые профы вероятность не опубликована, потому что пока что мало данных. Чуть позже и на них будут процены


      1. McKinseyBA
        24.10.2023 12:28

        Просмотрел все доступные без регистрации в разделе Data Science - нет ни одного %. А если доступно только при подписке на 4 канала, то - "фу" так делать без явного указания)

        Впрочем, реально крутой способ войти в IT. Pet project + статья на Хабр. Сам бы так делал.


  1. snayp
    24.10.2023 12:28

    вот это правильно! я о том же, что навык - пройти собес, никак не коррелирует с навыком программирования и абстракции.


  1. SergioT4
    24.10.2023 12:28

    Опубликуйте тогда уж и ссылки на все эти 630 видео и варианты ответов из интервью (можно пару-тройку самых интересных на ответ), хотя бы та на топ 20 вопросов.


    1. AlexAgree Автор
      24.10.2023 12:28

      Это все есть на сайте, ссылка в конце статьи


      1. SergioT4
        24.10.2023 12:28
        +8

        все есть на сайте

        На сайте есть регистрация на телеграм-анал, но 99% аудитории это не интересно .. так что можно считать этого нету.


        1. SergioT4
          24.10.2023 12:28

          все есть на сайте

          Смог зайти - до этого ошибку выдавало, типа не может подгрузиться.

          Было бы хорошо транскрипт собрать из видео и под ссылкой добавить текстовую версию ответа.

          Смотреть видео, это сильно много времени занимает. Плюс в текстовой версии можно быстро сравнить несколько вариантов ответов и это даст лучшее понимание.

          Ещё хороший вариант - для каждого вопроса добавить несколько версий ответов от gpt4. С промптами типа

          Как junior(middle/senior/architect) разработчик python, дай развёрнутый ответ на вопрос из интервью, добавь несколько примеров из предыдущего опыта работы - ... (тут вопрос).

          Это добавит полезности и интереса к сайту.


  1. max_zorn
    24.10.2023 12:28
    +4

    Я не боюсь 10 000 вопросов, я боюсь вопрос, заданный 10 000 раз…


  1. Jeshua
    24.10.2023 12:28
    +1

    С таким проектом можно вообще вопросы не задавать


  1. Dry_Ice777
    24.10.2023 12:28

    Очень круто получилось, залип серьезно)

    А на других языках собеседования и вопросы планируются? Помощь нужна?

    Можно было бы очень сильно бустануть сайт.


    1. AlexAgree Автор
      24.10.2023 12:28

      Вообще в планах было, напиши мне в телеграм @kivaiko


  1. xaosxaos2
    24.10.2023 12:28
    +1

    Вот ни разу не понял, человек 17 лет проработал на PHP, а вопрос задают по Python и при этом утверждают, что этот вопрос можно задать ЛЮБОМУ кандидату. Да ладно?


  1. answer42
    24.10.2023 12:28
    +1

    Не успел сделать проект, как заставляешь подписываться на какие-то каналы, чтобы им воспользоваться. С таким подходом спасибо, не надо.