Middle SRE
Мы в Skyeng меняем традиционное образование с помощью технологий. Сейчас в нашей IT-команде более 500 сотрудников, включая 200+ разработчиков. Наша разработка — это 47 независимых и быстрых продуктовых команд с опытными тимлидами и продактами.
Наши продукты — это онлайн-платформа Vimbox, Android и IOS-приложения, словари, браузерные расширения, внутренние CRM и финансовые системы. В 2020 году Skyeng вошел в топ 10 IT-компаний России.
Наша инфраструктура: 200+ железных серверов и виртуальные машины в AWS и Яндексе. Мониторинг на основе Prometheus, New Relic, Sentry, Kibana, а деплой — с помощью Jenkins. Инфраструктура разработки — классический LNPP стек (для полнотекстового поиска — Linux, Nginx, PostgreSQL, PHP). Почти мигрировали на docker-инфраструктуру на базе Docker Swarm и в 2021 перейдем на Kubernetes.
О команде. Команда InfraSRE занимается стабильностью всей экосистемы Skyeng. Мы находим потенциальные проблемы во взаимодействии сервисов и стараемся снизить риски от них, анализируем случившиеся отказы в работе сервисов и ищем способы предотвратить проблемы такого типа. Работаем на стыке разработки и эксплуатации.
Мы входим в подразделение Infra и в сотрудничестве с командами Ops, Devops, Monitoring и Support делаем Skyeng самой надежной школой в мире.
Какие задачи тебе предстоит решать?
-
Мониторинг по бизнес метрикам и оперативная реакция на инциденты в ключевых сервисах, аналитика инцидентов и проактивное участие в их решении. Работа над сокращением числа инцидентов и времени их исправления (регистрация+устранение);
-
Настройка мониторингов и алертов по бизнес-метрикам сервисов;
-
Разработка мероприятий для повышения стабильности продуктов Skyeng: учебные даунтаймы и разбор их результатов;
-
Оценка и ранжирование рисков, порождение задач на снижение риска падения сервисов;
-
Контроль и участие в исправлении конфигураций приложений;
-
Коммуникация с руководителями команд разработки и DevOps.
-
Понимание принципов SRE-практик;
-
Опыт работы со Swarm или Kubernetes, понимание принципов их работы;
-
Навыки разработки на PHP;
-
Понимание основных причин даунтаймов в Web приложениях и методах их предотвращения
-
Умение декомпозировать задачи, оценивать сроки и попадать в них.
-
Ответственность и проактивность.
-
Меняем образование — это важная цель в глобальном масштабе, делать социально-важное нереально круто, попробуй!
-
Сильная команда. Средний уровень разработчиков в компании — senior. Есть чему поучиться, есть с кем обсудить то, что уже знаешь;
-
Уникальный опыт: действительно сложные проблемы, которые можно встретить только в нагруженных проектах и сильно растущих компаниях;
-
Учимся сами: регулярные доклады разработчиков внутри компании, участие и выступления на конференциях;
-
Хакатоны и командные сборы в разных уголках мира — каждая команда выезжает на 2 недели вместе работать и отдыхать, хакатон объединяет всю команду IT;
-
Скидка 50% на уроки английского каждому сотруднику и другу;
-
Конференции, профессиональные курсы, выбирай и учись с оплатой от компании;
-
Можно влиять на компанию и её процессы;
-
Оплачиваемые отпуск и больничный;
-
Стабильная заработная плата два раза в месяц;
-
Работа в большой и амбициозной IT-компании с процессами, но без бюрократии;
-
Можно расти вместе со школой. Skyeng растет в 3 раза каждый год, сотрудники растут быстрее;
-
Можно работать удаленно из любой точки мира, а также из нашего уютного офиса в Москве (м. Таганская). Выбор за тобой.