Алертинг
Как real-time алерты снизили нам MTTR в 4 раза
Разбираем, почему скорость доставки сигнала важнее количества метрик, и как мы перестроили оповещения.
Как мы и наши пользователи строят надёжные системы: метрики, алерты, инциденты и немного инженерной кухни.
Разбираем, почему скорость доставки сигнала важнее количества метрик, и как мы перестроили оповещения.
Минимальный, но достаточный набор метрик и дашбордов для кластера, который реально помогает в инцидентах.
Какие признаки подозрительной активности видны прямо в телеметрии и как настроить на них детекторы.