Как достичь объективности в субъективном? Калибровка в performance review / forpes.ru

Главная
Как достичь объективности в субъективном? Калибровка в performance review

Как достичь объективности в субъективном? Калибровка в performance review +12

22.06.2021 12:40

Aist 26 1200 Источник

Чтобы сохранить контекст, придется кратко рассказать, что же такое performance review и как оно проходит в Юле. Не буду расписывать подробности, перечислю лишь основные этапы:

Self review: каждый сотрудник описывает и оценивает свои достижения за последние 6 месяцев. Следом выбирает коллег, которые смогут оценить и подтвердить эти достижения.
Peer review: коллеги оценивают результаты сотрудника, после чего у нас получается набор оценок по каждому сотруднику.
Калибровка: об этом этапе я хотел бы рассказать подробнее в этой заметке.
Донесение результатов performance review до каждого сотрудника.

Калибровка, как мне кажется, самый малоизвестный и слабопонятный этап во всем performance review. Если с self review и peer review всё более-менее ясно и не вызывает вопросов, то с калибровкой всегда есть недопонимание. Почему так? Наверное, из-за того, что большинство разработчиков никогда не присутствовали на калибровке лично. Из-за этого появляются догадки и домыслы, которые я хотел бы развеять. Давайте попробуем вместе разобраться, что же это за калибровка и как она происходит у нас в Юле.

Что дано?

Несколько команд, у каждой из которых есть свой руководитель (engineering manager).
Руководители направлений (руководители engineering manager’ов).
Лиды функций (frontend, backend, iOS, Android, QA).
СТО.
Результаты self и peer review в виде списка достижений каждого сотрудника с оценками.

Команд достаточно много, людей тоже немало, поэтому мы решили проводить калибровку в разрезе функции (frontend, backend, iOS, Android, QA), то есть сравнивать и оценивать между собой функционально близких ребят. Нам показалось, что будет сложно сравнивать backend-разработчика и iOS-разработчика.

Калибровочная сессия

Перед калибровочной сессией все участники получают сводную информацию для ознакомления. Это единый файл с таблицами по каждому сотруднику. В них приведены достижения и оценки из self review, оценки непосредственного руководителя (engineering manager) и оценки peer reviewers (без указания, кто и как оценил, только числа).

Разработчики в файле отсортированы по категориям от младшего к старшему, т.е. от Junior к Principle. Это нужно для того, чтобы в ходе калибровочной сессии рассматривать ребят в таком порядке и не терять фокус ожиданий, прыгая между категориями. Ведь нужно помнить, что требования и ожидания от junior-разработчика совершенно другие, чем от senior.

Когда все участники калибровочной сессии собираются, начинается презентация и обсуждение. Engineering manager представляет члена своей команды, рассказывает о том, что сделал этот человек, какие результаты показал, как повлиял на результат команды, как взаимодействовал с коллегами и т.п. Представление длится недолго, в зависимости от размера команды может идти от минуты до трех.

Сразу после этого все желающие могут и должны задавать вопросы про этого сотрудника. Цель этапа — получить максимально объективное мнение о заслугах и результатах работы сотрудника. На вопросы отвечает не только непосредственный руководитель, но и любой, кому есть что сказать о разработчике, находящемся в фокусе внимания. Этот этап может занимать от пяти до десяти минут. Иногда приходится прерывать обсуждения, когда «на сцене» какой-то неоднозначный персонаж, повлиявший на жизнь и работу большого количества коллег.

Затем настаёт время голосования. Используется техника planning poker. И так же как и при оценке задач, после вскрытия карт люди, давшие минимальную и максимальную оценки, аргументируют их. При необходимости проводится повторное голосование. Финальная оценка считается совместной и все участники голосования понимают, почему выставлена именно она.

Стоит отдельно сказать несколько слов про шкалу оценок. Мы выбрали:

2 — результаты работы сотрудника оказались ниже ожиданий от его текущей категории (грейда);

3 — результаты полностью соответствуют текущей категории и ожиданиям от сотрудника;

4 — результаты превзошли ожидания от текущей категории, такой кандидат достоин повышения (если такая оценка получается на первом performance review, скорее всего, сотрудник перейдет в следующую категорию);

5 — результаты работы превзошли все ожидания, это очень крутой результат и мы согласны, что этот сотрудник перерос свою текущую категорию.

Что мы получаем по завершению калибровочной сессии

У нас появляется список всех сотрудников с оценками, выставленными коллегией руководителей. Эти оценки максимально объективны, насколько могут быть объективны любые оценки, выставляемые одним человеком другому. Мы можем быть уверены, что эти оценки лишены протекционизма или, наоборот, специально занижены. На основании этих оценок принимаются решения о смене грейда каждого сотрудника. И руководителю проще подготовиться ко встрече, посвященной результатам оценки, потому что вклад каждого сотрудника в общий результат становится более наглядным и формализованным.

В любом процессе, где оценки выставляются людьми, присутствует субъективизм. Но performance review помогает снизить влияние личного мнения отдельных руководителей на результаты оценки работы сотрудника. Без калибровки, если бы оценки выставлял только руководитель, это было бы максимально субъективно. Например, ваш руководитель заморачивается по поводу пунктуальности, а вы считаете, что начинать рабочий день можно в любое время до утреннего командного стендапа, лишь бы работа делалась, да и компания в целом к этому относится нормально. Велик шанс, что какие-то ваши «бытовые» косяки будут влиять на оценку вашей работы, если для оценивающего эти косяки важны и существенны. В случае коллегиальной оценки руководителю будет сложнее повлиять на общий результат, если в компании не принято наказывать за «бытовые» косяки. Вас будут оценивать за результаты работы, а не за внешний вид, манеру говорить или любовь к несмешным мемам.

Может показаться, что очень многое в результате зависит от качества представления результатов работы, которое проводит engineering manager перед участниками калибровочной сессии. Не буду лукавить, хорошая презентация играет некоторую роль. Опытный менеджер может топить за своих ребят лучше, чем новичок. Но когда начинается сессия вопросов и ответов, когда менеджера начинают закидывать уточняющими вопросами, откровенный обман и сильное приукрашивание вскрываются. Невозможно плохого сотрудника представить хорошим, а прекрасно работающего — потопить.

Можно пытаться сломать систему, например, добавив в peer reviewers людей, которые будут лишь хвалить и ставить максимальные оценки. Но такой результат, скорее, вызовет лишние вопросы на калибровке.

Внимательный читатель задаст резонный вопрос: «Если окончательная оценка зависит лишь от калибровочной сессии, зачем нужны эти self и peer review? Почему менеджеры не могут просто собраться и договориться о повышениях?» Могут, более того, во многих компаниях так и происходит. Кажется, что более распространен радикальный вариант, когда решение принимается не коллегиально, а единолично каким-то руководителем. Но это плохой путь! Во-первых, крайне полезно попросить каждого сотрудника рефлексировать о своей работе, оглянуться назад и посмотреть, что удалось сделать и чего добиться. Во-вторых, калибровка помогает менеджеру увидеть зоны роста для каждого члена команды. Понять, что вот тут хорошо бы обратить внимание на это и приложить дополнительные усилия. В Юле мы считаем, что одна из основных задач менеджера — помогать сотрудникам расти и развиваться. Performance review очень хорошо помогает в этом процессе. Конечно, если сам сотрудник склонен к развитию и стремится к нему.

Комментарии (26)

JustDont
22.06.2021 16:03
#23176784
+1
Может показаться, что очень многое в результате зависит от качества представления результатов работы, которое проводит engineering manager перед участниками калибровочной сессии. Не буду лукавить, хорошая презентация играет некоторую роль. Опытный менеджер может топить за своих ребят лучше, чем новичок. Но когда начинается сессия вопросов и ответов, когда менеджера начинают закидывать уточняющими вопросами, откровенный обман и сильное приукрашивание вскрываются. Невозможно плохого сотрудника представить хорошим, а прекрасно работающего — потопить.
Весь абзац звучит, как сферические единороги в вакууме, уж извините.
Во-первых, представление чьих-то результатов другим человеком — всегда будет больше зависеть от представления, чем от результатов, если только у этих результатов нет конкретного практического выхлопа, который все участники этого собрания уже сами пощупали.
Во-вторых — окей, систематически скорее всего не выйдет представить хорошего сотрудника плохим и наоборот. А как насчёт "представить хорошего сотрудника обычным"?
В оценке сотрудников главная проблема далеко не в драмах и накале страстей а-ля "пришел в контору, сделал офигенно, а меня уволили". А в ползучей недооценке/переоценке, где личная (не)совместимость с конкретными людьми (в вашем случае — с представляющим) может значить гораздо больше, чем профит от сотрудника для компании.
1. Aist Автор
  22.06.2021 16:24
  #23176896
  Отчасти все так, представление результатов работы кем-то другим — это риск для сотрудника. Но мы постарались это учесть. На калибровке каждый видит, во-первых, ачивки сотрудника (что он сделал и что он сам про себя написал), во-вторых, все видят оценки пиров. Поэтому, получается чуть объективнее.
  Возможно, специфика наших команд такова, что мы ± понимаем результаты друг-друга, т.е. ачивки для нас говорят о результатах сотрудника. Поэтому мы видим крутых ребят и их сложно представить обычными (наоборот тоже не получится).
  Было бы интересно услышать варианты, которые сделают систему еще лучше, прозрачнее и удобнее для всех.
  1. JustDont
    22.06.2021 16:38
    #23176940
    +1
    Из того, что видел лично я и на своем опыте — всякого рода "объективная оценка" это всё такая же субъективная оценка, только оценивающих больше. И всякий профит от усреднения результатов нивелируется тем, что части оценивающих пофиг (а части — и вовсе глубоко пофиг), т.к. у них у всех совсем разная мотивация. И по факту всё равно оценивает очень ограниченный круг заинтересованных лиц. И в итоге всё идёт точно так же, как и в традиционной схеме через представление начальника, только при этом все радостно рассказывают по кругу, какие же они офигенно объективные.
    
    Aist Автор
    22.06.2021 18:15
    #23177352
    А помогает ли сотруднику полученная оценка пиров и колибровочной сессии? Ты разработчик, сидишь пилишь фичи, потом пишешь набор достижений, которые должны показать, почему ты молодец. В итоге получаешь в ответ оценки от пиров и от engineering manager’ов по каждой ачивке. Тут появляется возможность понять: «ага, вот эта штука мне казалась мега крутой и успехом, а коллеги это оценили вовсе не так. А тут — наоборот.» Новые вводные и обратная связь от системы :) Разве это не лучше, чем просто слова от прямого руководителя: «ну, Вася, ты в общем-то молодец, давай так же и дальше!»
    
    zloddey
    22.06.2021 18:24
    #23177380
    +1
    Тут появляется возможность понять: «ага, вот эта штука мне казалась мега крутой и успехом, а коллеги это оценили вовсе не так. А тут — наоборот.»
    Это обычное дело. Сколько людей — столько и мнений. Если твоя работа влияет на большое количество людей, критики найдутся всегда, что бы ты ни делал. Начнёшь подстраиваться под их мнение и делать всё иначе, так тут же заденешь чувства людей с другого фланга. Как же тогда быть?
    
    Aist Автор
    22.06.2021 18:37
    #23177428
    Не стоит подстраиваться, тут я согласен. Но может быть ситуация, например, такая. Ты сделал какое-то хорошее дело (с твоей точки зрения), внедрил линтер в пайплайн, допустим. Но, естественно, это вызвало боль у окружающих, кто привык жить без этого годами. На ревью пиры тебе наставили плохих оценок этой ачивке. Твои действия? Кажется, в этот момент будет правильным задуматься: «команда не хочет улучшать процессы или я чего-то не понимаю и стоит об этом поговорить?» Я вот про эту обратную связь, а не про то, что «в следующий раз я не буду ничего делать, чтобы не получить плохих оценок».
    И да, это дополнительная нагрузка на тимлида, которому нужно с каждым поговорить и узнать, как каждый воспринимает результаты ревью.
    
    YChebotaev
    22.06.2021 20:27
    #23177738
    Ну если про линтер мы знаем, что это в целом хорошо, то как быть с какой-то штукой, которая не так очевидна? Допустим, использовал я сегрегацию интерфейса при решении одной из задач и получил сдержанные оценки. Как это интерпретировать?
    
    Aist Автор
    22.06.2021 20:46
    #23177792
    А что говорит ваш тимлид? :) простите, недостаёт контекста. Но все это может и должно решаться в команде
    
    zloddey
    22.06.2021 20:55
    #23177834
    На ревью пиры тебе наставили плохих оценок этой ачивке. Твои действия? Кажется, в этот момент будет правильным задуматься: «команда не хочет улучшать процессы или я чего-то не понимаю и стоит об этом поговорить?»
    А что мешало пирам самим поговорить о том, что им неудобно? Если процесс разработки выстроен адекватно, то для этого даётся куча возможностей: митинги, командные ретроспективы, small talk на кофе-пойнте (увы, наша главная потеря в ковидные времена), внутрикомандные рассылки и чатики. В конце концов, цепочка 1on1 для самых деликатных ситуаций.
    
    Если же вопросы такого уровня выносятся на уровень performance review, тут уже, скорее, стоит спросить себя: почему не работают более быстрые циклы обратной связи? Но нет, нам некогда, мы тут не процессы улучшать пришли, а людей в покер разыгрывать.
    
    В общем, я пока что не готов покупать аргумент, будто бы процесс "пир ревью+калибровка" дают какой-то радикально более продвинутый фидбек для сотрудника. Да, менеджмент (особенно верхнеуровневый) получит больше информации о взаимоотношениях работников (потому что адекватно построенные процессы позволяют разруливать конфликты на уровне команды). Но поможет ли эта информация принимать менеджменту правильные решения, или же является обычным шумом?
    
    JustDont
    22.06.2021 18:28
    #23177394
    +1
    А помогает ли сотруднику полученная оценка пиров и колибровочной сессии?
    Конечно помогает. Когда есть какая-то мотивация к оценке, а обычно её нет.
    Вася сделал фичу для продукта, а я пилю другой продукт? Мне плевать на оценку Васи. Вася сделал фичу для продукта, и я пилю этот же продукт, но в другой части? Мне плевать на оценку Васи, если его фича не прибавит мне работы и не запорет продукт каким-то очевидным даже мне образом. Вася сделал фичу для продукта, а я работаю в этой же зоне, и считаю, что фичу надо было бы делать иначе? Оооо, мотивации тут может быть дофига, но вот непредвзятости — нисколько.
    
    И так далее. Когда есть мотивация для оценки коллег — это же обычно означает и пропорциональное уменьшение непредвзятости. Когда мотивации нет — всем пофиг и оценки ставят буквально от балды, или не ставят вовсе (если в этом нет обязаловки).
    
    Тут появляется возможность понять: «ага, вот эта штука мне казалась мега крутой и успехом, а коллеги это оценили вовсе не так. А тут — наоборот.»
    Так у вас в конторе что — фичи пилят для коллег? А не для успешности бизнеса в целом? Я к тому, что по вопросам "штука показалась крутой, а успеха нет" — тут вообще не на субъективные оценки надо смотреть, а на объективные цифры — либо финансовый результат, либо что-то ближе к продукту, но однозначно связываемое с финансовым результатом.
    
    Aist Автор
    22.06.2021 18:41
    #23177456
    В посте я не писал, но каждый сотрудник сам выбирает ревьюверов для своих ачивок, а менеджер может кого-то добавить (фактически, он старается прибавить объективности будущим оценкам). Вряд ли ачивки будет оценивать кто-то, кто совсем не в курсе того, что делал конкретный сотрудник.
    
    mvv-rus
    23.06.2021 03:39
    #23178570
    Вообще говоря, такой подход дает просто бездну простора для создания и борьбы враждебных группировок внутри организации. Не опасаетесь?
    
    Aist Автор
    23.06.2021 09:38
    #23179018
    Нет, не сильно опасаемся. Ведь если решение принимает один человек, так же есть коррупционные варианты. Но я, если честно, не слышал о таком никогда в ИТ компаниях.

zloddey
22.06.2021 18:13
#23177340
+1
Кажется, что более распространен радикальный вариант, когда решение принимается не коллегиально, а единолично каким-то руководителем. Но это плохой путь! Во-первых, крайне полезно попросить каждого сотрудника рефлексировать о своей работе, оглянуться назад и посмотреть, что удалось сделать и чего добиться. Во-вторых, калибровка помогает менеджеру увидеть зоны роста для каждого члена команды. Понять, что вот тут хорошо бы обратить внимание на это и приложить дополнительные усилия.
Простите, а чем именно плохой? Как принятие решения отдельно взятым руководителем противоречит этим "во-первых" и "во-вторых"? Если руководитель действительно заинтересован в росте своих подчинённых и "извлечении" из них пользы для компании, разве он не должен действовать таким же образом? Поговорить с человеком, обсудить успехи и проблемы, вместе подумать о путях развития и т.п.

Принятие решения единолично, между прочим, имеет одно важное отличие. У такого решения есть один конкретный ответственный. А тут, я не знаю, "мы разложили покер, и они решили поставить тебе двоечку. оспорить ты это уже не можешь — принимай как есть". Ну и никто не виноват, конечно, в такой оценке. Разве что сам работник, хаха.
1. Aist Автор
  22.06.2021 18:26
  #23177384
  Перформанс ревью ни в коем разе не подразумевает отсутствие возможности обсудить результаты. Ни в коем случае! С каждым сотрудником обсуждаются результаты, всегда есть возможность спросить «а почему так?» и всегда тебе смогут ответить. И это не будет ответ из серии «они так решили». Это будет ответ про то, как ты перформишь в команде в целом. Потому что у менеджера будут эти данные, он их получит от пиров и в результате калибровки.
  1. zloddey
    22.06.2021 20:23
    #23177730
    Я не специально написал "оспорить", а не "обсудить". Между этими понятиями есть глубокая разница. Спор подразумевает возможность изменить результат, а пост-обсуждение — нет. А то ведь, если немного утрировать, получается так:
    
    Почему у меня такая низкая оценка?
    
    Потому что некоторые твои коллеги были недовольны тем, как ты вёл себя на встрече X и как написал код сервиса Y. Так что мы решили понизить твой грейд, ты должен это понять.
    
    Окей :(
    
    Работник получит ответ на вопрос "почему?". Вот только вряд ли это его обрадует.
    
    Но тут мы уходим в сторону. Я задавал другой вопрос: чем конкретно единоличное принятие решения руководителем хуже коллегиального решения? Ответа, к сожалению, до сих пор не услышал. Очень плохо, мол, и всё тут.
    
    Aist Автор
    22.06.2021 20:41
    #23177780
    Калибровка помогает молодым/новым тимлидам понять ожидания и, простите за тавтологию, откалиброваться. Во время калибровки становятся более очевидны сильные и слабые стороны каждого члена команды на фоне остальных.
    А ещё решается проблема определения грейдов для ребят. Потому что формализовать на 100% описание каждого грейда очень сложно, а в ходе калибровки это становится очевиднее. При единоличном принятии решения о грейде вероятность «несправедливости» выше
    
    zloddey
    22.06.2021 21:04
    #23177872
    Ну так проводите калибровку отдельно, а "выставление грейдов" отдельно. Если рассматривать этот процесс как тренинг для молодых/новых тимлидов, то проблем никаких. Идея неплохая, я бы даже сказал. Хотя, конечно, стоимость самой процедуры стоило бы пооптимиздить.
    
    Но на мой взгляд, финальное решение по людям должно всё равно приниматься одним человеком. Коллективное решение рождает коллективную безответственность.
    
    Aist Автор
    22.06.2021 20:48
    #23177804
    А ещё у нас бывают случаи именно оспаривания результатов. Редко, но бывает. Это нормально. Если дискуссия предметная, подкрепляется фактами, то в этом нет ничего плохого.

Taus
23.06.2021 00:04
#23178342
Невозможно плохого сотрудника представить хорошим, а прекрасно работающего — потопить.
С первой частью можно согласится, но никак не со второй. Обесценить работу любого человека легко, особенно если сам сотрудник не умеет защищаться от такой критики.
1. zloddey
  23.06.2021 05:48
  #23178644
  Тут ведь дело ещё веселее. Не важно даже, умеет ли он защищаться сам. Его-то и не спросят в случае каких-то разногласий на "калибровке". Обсудят заочно и швырнут результат в лицо.
  1. Aist Автор
    23.06.2021 09:44
    #23179048
    Почему вы делаете такой вывод? Почему вам кажется, что цель этого процесса обидеть кого-то? Вы бы не захотели объяснить оценку члену своей команды, а просто «швырнули результат в лицо»?
    Понимаю, что скорее всего вы бы не захотели даже работать в компании с подобным процессом ревью. И это нормально. Поэтому на собеседованиях мы рассказываем кандидатам о том, как и что у нас утроено. Чтобы человек не расстроился, столкнувшись с первым перф.ревью.
1. Aist Автор
  23.06.2021 09:48
  #23179070
  Важно, что человеку в этой схеме чаще всего и не нужно защищаться. Может быть это особенность наших команд, но у нас коллеги плюс-минус представляют, что делают ребята в команде (а иногда даже и в соседних, потому что общаются друг с другом, проводят код ревью и т.п.). Поэтому твои ачивки могут оценить достаточно объективно и шанс того, что все ревьюверы «сговорились» против — очень невелик.
  1. Taus
    23.06.2021 11:17
    #23179556
    Пока интересы команд не перекрываются, например неограниченное число должностей для повышения, то они в большей своей части дают адекватные оценки другим. Кажется, что когда будет перекос в чью-то сторону (не очень важно по каким критериям), то подобный подход не поможет наладить взаимопонимание между командами.

mad_nazgul
23.06.2021 07:47
#23178752
+1
Back in USSR.
Круговая порука и коллективная ответственность. :-)
1. Aist Автор
  23.06.2021 09:39
  #23179022
  +1
  Как ни странно, но эту схему оценки сотрудников придумали вовсе не в СССР, а совсем наоборот.

Как достичь объективности в субъективном? Калибровка в performance review +12

Калибровочная сессия

Что мы получаем по завершению калибровочной сессии

Комментарии (26)

Aist Автор

Aist Автор

Aist Автор

Aist Автор

Aist Автор

Aist Автор

Aist Автор

Aist Автор

Aist Автор

Aist Автор

Aist Автор

Aist Автор