Middle/Senior SRE

удаленно / иннополис

Site Reliability Engineers - специалисты по надежности работы систем. Обычно опытные разработчики и админы, которые способны сами поднять нужные инструменты или написать их с нуля. Дают объективные метрики о качестве наших решений и проектируют инфру вокруг них для обеспечения целевых показателей.

Обязанности

  • Поддержка и отстройка системы мониторинга
  • Обеспечение бесперебойной работы инфраструктуры компании
  • Дежурства и реагирование на инциденты
  • Автоматизация настройки и развертывания систем
  • Автоматизация восстановления систем (где это возможно)
  • Определение SLI и обеспечение SLO
  • Принуждение к политикам релизного цикла
  • Работа с разработкой по улучшению observability проектируемых систем

Что мы ждем от кандидата?

  • Опыт коммерческой разработки или опыт администрирования крупных распределенных систем
  • Опыт работы с системами мониторинга на основе метрик (prometheus, telegraf, etc.), рисования полезных дашбордов
  • Provisioning/IaaC (ansible, terraform, etc.)
  • Опыт траблшутинга/тьюнинга linux-based систем. То же самое на уровне железа - огромный плюс
  • Хорошие навыки коммуникации
  • Аналитический склад ума
  • Ненависть к беспорядку и багам

Бонусы

  • Мы аккредитованы
  • Можно работать на полной удаленке
  • Компенсируем аренду жилья в Иннополисе после года работы
  • ДМС
  • Покупаем недостающее оборудование по запросу
  • Дружелюбная и слаженная команда специалистов
  • Отсутствие микроменеджмента и атмосфера доверия
  • Минимум бесполезных встреч и совещаний
  • Гибкий график
  • Свобода принимать решения и ответственность за их последствия
  • Гарантированное место за столом в Вальгалле после испытательного срока
Согласен на обработку персональных данных. Согласие
По вопросам работы сайта можно писать на apply@invian.ru

Подготовиться к следующим этапам:

> Процесс найма

> Подробнее о наших задачах

Спроектировано и разработано командой Инвиан © 2024