Как мы ввели автосертификацию дашбордов в Авито / forpes.ru

Главная
Как мы ввели автосертификацию дашбордов в Авито

Как мы ввели автосертификацию дашбордов в Авито +12

06.01.2026 16:19

EvgMich 2 7100 Источник

Привет, Хабр! Меня зовут Евгений Мичурин, я senior BI-разработчик в Авито.

Если у вас BI растёт хаотично — вы наверняка сталкивались с тем же, что и мы: сотни дашбордов, разный стиль, неясные владельцы, дублирующиеся датасеты. В какой-то момент это превращается в хаос, где пользователи не доверяют данным, а self-аналитика становится невозможной.

Мы решили навести порядок и создали фреймворк автосертификации BI‑отчётов. В этой статье рассказываю, как он работает, какие критерии мы выбрали и как мотивировали команды участвовать в процессе.

Введение. Проблема отсутствия маркера качества

В Авито, как и во многих больших компаниях, BI развивался органично и изолированно. Каждая команда создавала дашборды под свои нужды, используя разные подходы, источники, стандарты и стайлгайды. В итоге мы оказались в точке, где имели:

сотни дашбордов с разной скоростью работы;
пустые или формальные описания, в которых невозможно разобраться;
неясных владельцев — люди уходили из компании, а отчёты оставались;
дашборды с прямыми запросами к продовым базам, тормозившие систему;
дублирующиеся датасеты с минимальными различиями, занимавшие место на диске.

Последствия были предсказуемыми:

62% пользователей испытывали трудности при поиске нужного отчета в Redash;
41% не доверяли данным и требовали валидации у аналитиков;
self‑service аналитика была невозможна;
внедрение ИИ‑ассистентов становилось рискованным — они могли «научить» пользователей на плохих данных.

Мы поняли: нужны стандарты качества. Так появился фреймворк сертификации BI‑отчётов — система автоматической проверки по ключевым аспектам.

Позже мы добавили понятие «ключевого отчёта», но сначала поговорим о сертификации.

Что такое сертифицированный отчёт

Сертифицированный отчёт — эталонный BI‑продукт, прошедший автоматическую и комплексную проверку по стандартам качества. Его использование обеспечивает:

надежность данных — точность и актуальность;
производительность — высокая скорость работы;
понятность — полные описания и метаданные;
поддержку — закреплённый ответственный разработчик.

Мы полностью переработали интерфейс Redash под нужды сертификации: добавили статус качества в хедер, изменили главную страницу поиска с акцентом на сертифицированные и ключевые отчеты.

На главной странице нас сразу встречает:

название отчета;
признак ключевого отчета;
дата обновления всех источников;
статус автосертификации:
- ✅ Сертифицирован
- ? Нужны доработки
- ? Не сертифицирован
- ? На проверке;
иконки для каналов поддержки и документации.

При наведении на иконку можно увидеть, в каком блоке отчета есть проблемы.

В поиске также сделан акцент на сертифицированные и ключевые отчеты.

Критерии автосертификации

Мы определили четыре основные группы критериев, из которых складывается признак автосертификации.

Метаданные

Подробное описание метаинформации отчёта положительно сказывается на опыте пользователя — ему легче найти отчёт в поиске, понять его назначение и найти ответственных.

Специально под эти критерии мы разработали и добавили в интерфейс Redash «Админ‑панель», где автор должен полностью описать все поля меты: название, подзаголовок, описание для поиска, целевую аудиторию и ссылки на каналы поддержки или документацию.

Условия для прохождения проверки:

отчет должен иметь корректное название (без капса, цифр подряд и т.д.);
Readme (подробное описание отчёта) должно быть ≥ 300 символов;
заполненный Description (краткое описание) — отображается при поиске отчёта в Redash;
External links (внешние ссылки) — обязательно хотя бы одна ссылка на канал поддержки;
Target audience (целевая аудитория) — должна быть заполнена, чтобы отчёт попадал в блок рекомендаций для нужной группы пользователей.

Это нужно, чтобы улучшить поиск и сократить время онбординга новых пользователей.

Производительность

Сертифицированный отчет должен быть оптимизирован и быстро работать. Это технический критерий, который складывается из двух пунктов:

скорость — время отклика дашборда < 7 секунд (среднее за месяц). Хорошо оптимизированный отчёт меньше нагружает систему и дает пользователю лучший опыт;
процент ошибок — доля открытий с ошибкой < 5% (среднее за месяц). Это показывает, что разработчик проработал все сценарии использования. Простейший пример — ошибка деления на 0 при отсутствии данных в определенном срезе.

Для повышения производительности мы рекомендуем использовать специально подготовленный гайд по оптимизации.

Источник данных

Сертифицированный отчет должен быть построен на проверенных и качественных источниках.

Во-первых, Health Score датасета > 85%. Это внутренняя метрика качества, которая рассчитывается по формуле:

HealthScore = 0.3 Техническое cостояние + 0.25 Архитектурная чистота + 0.25 Актуальность источника + 0.1 Гигиена кода + 0.1 * Бизнес‑значимость

Во-вторых, отчёт построен на датасетах — продовые отчёты не содержат прямых запросов к Vertica/Trino. Мы делаем весь BI на ClickHouse (с редкими исключениями).

Статус качества датасета прозрачен и доступен для проверки каждому пользователю.

Актуальность

В сертифицированном отчёте каждый объект должен иметь актуального владельца и быть доступным в поиске.

У всех объектов отчета есть владелец, работающий в компании.
Нет архивных объектов — в Redash нельзя удалять объекты, мы их архивируем, но они не должны попадать в сертифицированный отчёт.
Отчет опубликован и доступен для поиска.
Отчет не находится в песочнице. Для этого мы добавили в Redash новое свойство проекта — is sandbox.

Это самые простые и базовые критерии из всего списка.

Ключевые отчеты: фокус на главном

Теперь подробнее про признак «ключевого отчета» — отчета, который:

собирает больше всего трафика в своём домене;
отвечает на самые важные бизнес‑вопросы;
рекомендуется к использованию внутри домена («этим отчетом сейчас точно можно пользоваться»).

Ключевые отчёты получают специальную метку в интерфейсе. Это помогает новым пользователям быстрее находить верхнеуровневые отчёты, в которых они наверняка смогут получить проверенные данные. Разработчикам это дает четкую фокусировку на конкретном пуле отчётов — мы не распыляем силы на всё, а делаем упор на избранной прослойке отчётности.

Если автосертификация работает в независимом режиме, то признак «ключевого отчёта» проставляется вручную и накладывает дополнительную ответственность BI‑тимлидов.

Как мы сейчас влияем на качество отчетов?

Сертификация — это цель, но нужно как-то агитировать людей на её достижение. Для этого несколько раз в год мы проводим мероприятие BI‑субботник.

Что такое BI‑субботник? Это регулярная активность, где:

Аналитики работают над своими отчетами (каждая команда ограничена по‑своему, но в среднем это 3 SP в спринт);

BI‑разработчики помогают аналитикам и оптимизируют объекты;

BI‑партнеры (ответственные за домен) курируют процесс, следят за прогрессом и обосновывают необходимость изменений.

Наш последний субботник был в основном направлен на заполнение отчетов новыми полями метаинформации и удаление ненужных витрин.

Для долгосрочных задач — оптимизация медленных запросов; устранение дублирования датасетов; перенос расчётов на ClickHouse — мы создаём специальные задачи в Jira с тегом bi‑health, что даёт нам понимание нагрузки.

Ну и конечно, проще сделать сразу хорошо, чем потом исправлять, поэтому мы пропагандируем продуктовый подход к разработке отчётности.

Прогресс сертификации отслеживаем через дашборды.

Ключевым для скорости итераций оказалось архитектурное разделение ответственности: команда Redash предоставила нам гибкий бэкенд для интеграции, а команда BI отвечает за расчет и передачу признаков автосертификации. Это позволило независимо тюнить бизнес-логику проверок и мгновенно добавлять новые критерии — без блокировки на релизах Redash и без ожидания чужих спринтов.

Результаты

За 1,5 месяца мы смогли:

✓ Сертифицировать порядка 440 отчётов (≈12% от всех);

✓ Актуализировать статус у около 3 тысяч дашбордов;

✓ Переработать UI Redash в лучшую сторону.

Что дальше?

Сертификация — не разовая акция, а культура качества данных. Наши следующие шаги:

автоматизация проверки — чтобы статус сертификации обновлялся в реальном времени. Пока мы живем с лагом;
введение цикла ревью ключевых отчетов — ручные проверки отчетов, с повторным подтверждением статуса «ключевого» через полгода;
интеграция с внутренними ИИ‑ассистентами — чтобы они рекомендовали в первую очередь сертифицированные отчёты;
расширение автосертификации на другие объекты — датасеты, витрины и т. д.;
создание удобных сертифицированных коллекций отчётов, которые будут размещаться на специальном BI-портале.
программа «BI‑Амбассадоров» — лучшие практики от самых качественных команд.

Советы для других компаний

Если вы задумываетесь о внедрении подобной системы:

начните с фреймворка сертификации — четкие критерии лучше абстрактных пожеланий;
автоматизируйте сбор метрик — Health Score стал нашими «глазами»;
проводите регулярные субботники с конкретными целями — можно начать с одного раза в год, потом постепенно увеличивать и в конечном итоге дойти до автоматизации процесса (что мы и планируем).
вовлекайте обе стороны — и владельцев (аналитиков), и разработчиков;
создайте канал поддержки — это снижает трение и ускоряет процесс;
не наказывайте, а помогайте — субботники это не про KPI, а про улучшение экосистемы;
не бойтесь менять планы — в процессе реализации могут всплыть неожиданные вещи, как у нас с «ключевыми отчетами».

Заключение

Чистота BI — это не про эстетику, а про эффективность. Качественные данные → быстрая аналитика → правильные решения → рост бизнеса.

Сертификация дашбордов в Авито — это наш способ навести порядок в данных, чтобы каждый сотрудник мог самостоятельно находить ответы и принимать решения.

Но самое важное — это часть более глубокого подхода к дашбордам как к продукту. Мы, как и многие, проектируем новый опыт получения инсайтов через Gen AI-ботов. В этой перспективе юзкейсы дашбордов будут естественным образом сужаться до мониторинга и репортинга, а задачи исследований и разовых выгрузок будут всё больше уходить к AI-инструментам.

Однако этот эффект не отменяет дашборды как сущность — а наоборот, делает их роль еще более важной. Если Gen AI будет рекомендовать и строить выводы на основе данных, то критически возрастает важность разметки здорового контента, сертификации источников и рекомендаций на основе объективных метрик качества. Чем лучше мы разметим нашу BI-экосистему сегодня, тем умнее и полезнее будут наши AI-ассистенты завтра.

В конечном счёте, автосертификация — это не только про порядок в данных, но и про подготовку инфраструктуры для следующего шага эволюции аналитики, где аналитик и AI работают в паре, опираясь на проверенные, качественные и хорошо описанные данные.

Комментарии (2)

Maratinhos
06.01.2026 18:52
#29348188
Привет.

Спасибо за статью. Интересно было читать.
- Уточните пожалуйста есть ли какие-то SLA по дашбордам/датасетам/витринам? Если есть то участвовуют ли они в сертификации дашбордов?
- Также про Data Quality, явным образом про это ничего нет в статье, участвует ли оно в сертификации дашбордов?
- Транслируется ли эта информация на потребителей дашбордов и как они инструктированы в случае если их любимый дашборд перестал быть сертифицирован? Что вообще планируется делать с красными/желтыми дашиками которые продолжат пользоваться популярностью?
- Есть ли какие-то идеи по приоритизации обновления датасетов на основе сертификации дашбордов?

Ivan22
06.01.2026 18:52
#29351232
HealthScore = 0.3 Техническое cостояние + 0.25 Архитектурная чистота + 0.25 Актуальность источника + 0.1 Гигиена кода + 0.1 * Бизнес‑значимость

а можно подробнее как это все считается??? На глаз, чтоли??