@AntonDovnar

Привет, меня зовут

Антон Довнар

Incident & Problem Manager в финтехе

Строю процессы управления инцидентами, которые защищают выручку, снижают MTTR и делают платёжные системы предсказуемыми. 7+ лет в Incident & Problem Management, из них 3+ года в платежах и высоконагруженных продуктах.

Мое резюме

Обо мне

Я занимаюсь построением и развитием процессов Incident & Problem Management для платёжных и продуктовых команд: от круглосуточного мониторинга до постмортемов и RCA.

Дважды собирал команды с нуля, внедрял дашборды в Grafana/Power BI, систему оповещений и базы знаний, которые помогают быстрее находить причины инцидентов и снижать потери бизнеса.

Опыт работы

Озон

Дзен

Fintech

Озон

Координировал 15–20 инцидентов в день в распределённой системе из 3500+ микросервисов;
средний MTTR составлял ~25 минут.
Руководил оперативным устранением критических P0-сбоев, (до 5 команд одновременно).
Улучшил шаблон постмортема, сократив время подготовки отчёта об инциденте на 16% и повысив качество анализа причин.
Поддерживал и пополнял базу знаний в Confluence (создал 50+ статей по процессам и решениям инцидентов).

В работе использовал: Jira, Confluence, Grafana, SQL, внутренний аналог PagerDuty

Дзен

Сформировал с нуля круглосуточную команду 24/7 мониторинга и реагирования на инциденты.
Внедрил процессы triage и эскалации, что позволило снизить среднее время восстановления (MTTR) на ~35%.
Автоматизировал сбор метрик и логов для последующего анализа инцидентов и написания постмортемов.
Организовал единый коммуникационный канал для оповещения о статусах инцидентов.

В работе использовал: Jira, Confluence, Grafana, SQL, Yandex Monitoring, Juggler

Fintech

С нуля построил команду для обработки платёжных инцидентов в 7+ ГЕО.
Сделал более 10 дашбордов для выявления спам-транзакций.
Внедрил оповещения через Telegram-ботов и SLO-борд; обеспечил обнаружение критических P0-инцидентов в течение ≤3 часов при 100%-м соблюдении SLO.
Перевёл ведение всех инцидентов в Jira: разработал подробные runbook-инструкции и шаблоны постмортемов для команды.
Создал базу знаний RCA (Root Cause Analysis) с классификацией по продуктам и типам отказов для ускорения расследований.
Еженедельно готовлю отчёты по инцидентам для CPO с анализом причин и метрик.
Руковожу ликвидацией наиболее серьёзных (P0) сбоев, координируя одновременно работу до 6 команд.

В работе использовал: Jira, Confluence, Grafana, SQL, Power BI, Excel, внутренние админ-панели для маршрутизации платежей.

Мои проекты

Фриланс-проект

СПЕКТР

Сайт независимой энергосбытовой компании занимающейся оказанием услуг на рынке электроэнергии
- PHP
- Bitrix
- HTML
- CSS
- JS
- PhpStorm
Личный проект

Сайт визитка

Сайт который я создал для самопрезентации
- PHP
- HTML
- CSS
- JS
- PhpStorm