Skyeng
Москва
Удаленная работа, От 3 до 6 лет, Полная занятость, Стандарт

Мы в Skyeng меняем традиционное образование с помощью технологий. Сейчас в нашей IT-команде более 500 сотрудников, включая 200+ разработчиков. Наша разработка — это 47 независимых и быстрых продуктовых команд с опытными тимлидами и продактами.

Наши продукты — это онлайн-платформа Vimbox, Android и IOS-приложения, словари, браузерные расширения, внутренние CRM и финансовые системы. В 2020 году Skyeng вошел в топ 10 IT-компаний России.

Наша инфраструктура: 200+ железных серверов и виртуальные машины в AWS и Яндексе. Мониторинг на основе Prometheus, New Relic, Sentry, Kibana, а деплой — с помощью Jenkins. Инфраструктура разработки — классический LNPP стек (для полнотекстового поиска — Linux, Nginx, PostgreSQL, PHP). Почти мигрировали на docker-инфраструктуру на базе Docker Swarm и в 2021 перейдем на Kubernetes.

О команде. Команда InfraSRE занимается стабильностью всей экосистемы Skyeng. Мы находим потенциальные проблемы во взаимодействии сервисов и стараемся снизить риски от них, анализируем случившиеся отказы в работе сервисов и ищем способы предотвратить проблемы такого типа. Работаем на стыке разработки и эксплуатации.

Мы входим в подразделение Infra и в сотрудничестве с командами Ops, Devops, Monitoring и Support делаем Skyeng самой надежной школой в мире.

Какие задачи тебе предстоит решать?

  • Мониторинг по бизнес метрикам и оперативная реакция на инциденты в ключевых сервисах, аналитика инцидентов и проактивное участие в их решении. Работа над сокращением числа инцидентов и времени их исправления (регистрация+устранение);

  • Настройка мониторингов и алертов по бизнес-метрикам сервисов;

  • Разработка мероприятий для повышения стабильности продуктов Skyeng: учебные даунтаймы и разбор их результатов;

  • Оценка и ранжирование рисков, порождение задач на снижение риска падения сервисов;

  • Контроль и участие в исправлении конфигураций приложений;

  • Коммуникация с руководителями команд разработки и DevOps.

Требования:
  • Понимание принципов SRE-практик;

  • Опыт работы со Swarm или Kubernetes, понимание принципов их работы;

  • Навыки разработки на PHP;

  • Понимание основных причин даунтаймов в Web приложениях и методах их предотвращения

  • Умение декомпозировать задачи, оценивать сроки и попадать в них.

  • Ответственность и проактивность.

Условия:
  • Меняем образование — это важная цель в глобальном масштабе, делать социально-важное нереально круто, попробуй!

  • Сильная команда. Средний уровень разработчиков в компании — senior. Есть чему поучиться, есть с кем обсудить то, что уже знаешь;

  • Уникальный опыт: действительно сложные проблемы, которые можно встретить только в нагруженных проектах и сильно растущих компаниях;

  • Учимся сами: регулярные доклады разработчиков внутри компании, участие и выступления на конференциях;

  • Хакатоны и командные сборы в разных уголках мира — каждая команда выезжает на 2 недели вместе работать и отдыхать, хакатон объединяет всю команду IT;

  • Скидка 50% на уроки английского каждому сотруднику и другу;

  • Конференции, профессиональные курсы, выбирай и учись с оплатой от компании;

  • Можно влиять на компанию и её процессы;

  • Оплачиваемые отпуск и больничный;

  • Стабильная заработная плата два раза в месяц;

  • Работа в большой и амбициозной IT-компании с процессами, но без бюрократии;

  • Можно расти вместе со школой. Skyeng растет в 3 раза каждый год, сотрудники растут быстрее;

  • Можно работать удаленно из любой точки мира, а также из нашего уютного офиса в Москве (м. Таганская). Выбор за тобой.