МАГНИТ, Розничная сеть
Москва
Полный день, От 1 года до 3 лет, Полная занятость, Стандарт

Ключевые навыки

Python
Data Mining
SQL
ORACLE
Статистический анализ

Мы развиваем собственный Аналитический центр Data Science и Machine Learning и приглашаем в команду Data Scientist на ключевые проекты.

Работа ведется в командах 5-6 человек, включает в себя бизнес-аналитиков, data scientist, data engineer, руководитель направления.

Наши задачи:

  • Разработка статистических моделей/алгоритмов и их реализация на R, Python;
  • Оптимизация инструментов и подходов к решению задач;
  • Прогнозирование промо продаж компании до различных разрезов;
  • Прогнозирование регулярных продаж компании до различных разрезов;
  • Разработка рекомендательных систем на основе данных карт лояльности компании.

Ожидания:

  • Навыки работы с современными аналитическими пакетами на R/Python;
  • Умение работать со стеком технологий BigData (Hadoop, Spark, Hive);
  • Опыт работы с промышленными хранилищами данных (Oracle, Teradata, SAP) будет плюсом;
  • Хорошие знания и опыт работы в прикладной статистики;
  • Знание процессов и моделей торговых компаний будет плюсом;
  • Знания в области методов разделения данных для проведения корректной оценки моделей машинного обучения;
  • Знания в области использования валидации данных и подбора параметров настройки для моделей машинного обучения;
  • Знания в области оценки данных на предмет аномалий, пропусков, нормализации данных, восстановления и препроцессинга данных;
  • Понимание и умение использовать более сложные методы решения задач машинного обучения: деревья, линейные модели (лассо, гребневая), метод опорных векторов, метод различные кластеризации, методы снижения размерности;
  • Опыт использования в анализе временного ряда моделей ARIMA/SARIMA;
  • Опыт предобработки исходных данных и нормализации целевой переменной для повышения качества моделей;
  • Опыт использования основных методов кластеризации для создания разметки данных;
  • Опыт использования базовых методов классификации (формирование рекомендаций) для новых объектов в данных;
  • Понимание и умение объяснить задачи, связанные с моделированием в машинном обучении

Мы предлагаем:

  • Современная платформа данных: Teradata, SPSS, стек Hadoop, Tableau, QlikView;
  • Объемы основных транзакционных данных 120+ ТБ;
  • Объемы в Hadoop (в разработке) 1,5 ПБ;
  • Прототипы аналитики в реальном времени, высоконагруженные сервисы;
  • Участие в разработке цифровых продуктов (моб. приложение, оборудование в магазинах и пр.);
  • Возможна удаленная работа