Привет! Это пост-отчёт с митапа Backend United, нашей серии тематических встреч для разрабочиков серверной части. В этот раз мы много говорили о работе с инцидентами, обсуждали, как выстроить свою систему для улучшения incident response и убедились в ценности техдолга.
Заходите под кат, если вам интересны эти темы. Внутри вы найдёте материалы встречи: видеозаписи докладов, презентации спикеров, отзывы гостей митапа и ссылки на фотоотчёт.
Доклады
Простые инструменты для улучшения incident response: опыт Tutu. Андрей Борзов (Tutu.ru)
Андрей рассказал, как в Tutu облегчили себе жизнь во время инцидентов с помощью простых технических решений. У них получилась настраиваемая система для команд, которая делает важную для них диагностику ближе, алерты от разных систем — полезнее, а их маршрутизацию — проще.
Отзывы слушателей
- «Интересно послушать о применении похожих технологий, применяемых в нашей компании».
- «Команда — молодцы. Но сейчас пилить свои велосипеды не очень продуктивно для компании, у которой этот велосипед не является бизнес-продуктом. Из-за этого не рассматриваю это решение как образец для внедрения, но многие проблемы, которые были озвучены, приняты во внимание. Благодарю. Полезно».
Работа с Production взрывами: обнаружение, оценка потерь, управление инцидентами. Дмитрий Химион (Авито)
Дмитрий рассказал о том, как в Авито устроена практика управления инцидентами, и какие изыскания и автоматизацию мы применяем в нашей работе.
Отзывы слушателей
- «Многое законспектировал, класс».
- «Интересно и структурировано».
AutoLSR — автоматизированный сбор сведений при значительных инцидентах. Владимир Колобаев (Авито)
Мы собрали все тайные знания, сценарии отказов различных систем и сервисов и перенесли все это в код с целью автоматизированного обнаружения и первичного анализа значительных инцидентов. Об этом — доклад Владимира.
Отзывы слушателей
- «Интересный и полезный доклад».
- «Легкий и интересный доклад».
Мы это сломали сейчас, но починим потом. Техдолг и его ценность. Борис Кайзер (Ozon)
Борис рассказал, что они с командой делают для контроля всего того, что ломается и оперативно чинится, как они помогают разработке не забыть про данные обещания, а также как обеспечивают бизнес полной и понятной информацией о том, что произошло, как починили и что будет сделано, чтобы ситуация не повторилась.
Отзывы слушателей
- «Опсджини :) Люблю узнавать о новых технологиях».
- «По моему мнению — лучший доклад. Грамотно, интересно и практично. Много для себя вынес».
Немного фотографий
Все фотографии мы выложили в Фейсбуке и ВК. Посмотрите, как это было, и отмечайте себя и друзей, если были на встрече.
Ссылки
Плейлист со всеми видео с митапа можно найти на нашем ютуб-канале.
Все новые мероприятия для разработчиков мы публикуем, прежде всего, на нашем Таймпаде. Подписывайтесь, чтобы не пропустить.
До новых встреч!