Инженер доступности сервисов Middle / Middle+

З/п не указана
Опыт работы: От 3 до 6 лет
График работы: Полный день
Занятость: Полная занятость
Компания: Леруа Мерлен

Миссия команды Observability - обеспечить наблюдаемость и прозрачность работы всех приложений и процессов компании, предоставляя командам оптимальные инструменты и экспертизу.
Команда работает в 3 направлениях: инженерное, аналитически-процессное и прикладное, которое покрывает работу над инструментами для команд разработки (Slack, Jira и т.п).

Тебе предстоит:
  • Помогать продуктовым командам развивать мониторинг, внедрять методики обеспечения надежности и применять прочие SRE практики;
  • Участвовать в построении общекорпоративной экосистемы мониторинга, алертинга, хранения метрик и визуализации (разработка и предоставление инструментов "как сервис");
  • Обеспечение бесперебойной работы сервисов и поддержка инфраструктуры команды;
  • Управление конфигурацией, автоматизация развертывания и обновления сервисов, и прочих рутинных операций (configuration management, Infrastructure as Code).
Требования:
  • Понимание принципов работы систем мониторинга и алертинга, метрик и time series, построения графиков и т.д.;
  • Понимание практик SRE, в том числе критерии доступности - SLO, SLI, SLA
  • Опыт администрирования Linux (CentOS, Ubuntu), баз данных и работы с сетевым стеком (HTTP, TCP/IP, DNS, REST API);
  • Опыт работы с системами виртуализации и контейнеризации;
  • Опыт работы с Kubernetes, организации его мониторинга и владение Helm;
  • Владение любым языком: Bash, Python, Go, Groovy и т.д.;
  • Уверенное владение английским языком (мы плотно взаимодействуем с зарубежными коллегами).
Приветствуются:
  • Понимание паттернов обеспечения отказоустойчивости - load balancing, circuit breakers, disaster recovery;
  • Опыт работы с Яндекс.Облаком и Terraform;
  • Опыт построения long-term хранилища метрик на базе VictoriaMetrics/Thanos/Cortex/Grafana Mimir будет большим плюсом;
  • Опыт внедрения трассировки (tracing) на базе OpenTelemetry будет большим плюсом;
  • Опыт построения HA реализаций мониторинга на базе Prometheus stack;
  • Умение работать с Git, Ansible/Salt, JSON, YAML и опыт написания CI/CD пайплайнов;
  • Понимание методологии DevOps и опыт взаимодействия с Agile командами разработки.
Условия:
  • Прозрачные условия для профессионального и карьерного роста, наши сотрудники имеют все возможности для горизонтального и вертикального перехода;
  • Ежемесячная (5%) и ежеквартальные премии (до 25% от общего квартального дохода) + оклад;
  • ДМС со стоматологией от Ренессанс, телемедицина;
  • Страхование от несчастных случаев;
  • Ежемесячно выплачивается дотация на питание;
  • Участие в конференциях и во внутренних, и внешних митапах;
  • Гибкий график и возможность работать удалённо;
  • Английский и французский язык для изучения по согласованию;
  • Корпоративные скидки.
Хочу откликнуться
<
>