Газпром-медиа Развлекательное телевидение (ГПМ РТВ)
Москва, Большая Садовая улица, 5к1
Маяковская
Полный день, От 3 до 6 лет, Полная занятость, Стандарт

Ключевые навыки

Python
Git
PostgreSQL
Django Framework
Django
Linux
Docker

Кого ищем: Middle Data Scientist с уклоном в рекомендательные системы в Департамент Управления Данными (ДУД) компании Uma.Tech (входит в холдинг “Газпром-медиа”).

О команде:

ДУД отвечает за централизованный сбор, хранение, обработку и анализ данных из всевозможных источников холдинга, создание новых продуктов на основе данных. ДУД состоит из команд разработки, тестирования, эксплуатации, продуктовых аналитиков и специалистов по анализу данных (DS).

Проекты:

  • Рекомендательные системы видео и текстового контента на сайте спортивных новостей Matchtv.ru
  • Рекомендательные системы видеоконтента на сайте онлайн-кинотеатра Premier.one

Используемые в проектах технологии:

  • Python: ML стек, Django, Celery
  • ClickHouse, PostgreSQL, Redis, Kafka
  • Scala, Spark, Spark ML, Ignite, Spring
  • CI/ CD: Docker, Gitlab-ci, Kubernetes

Задачи:

  • Генерация и проверка гипотез (сбор, анализ, визуализация данных и результатов работы моделей)
  • Подготовка наборов данных, разработка регулярных пайплайнов сбора данных
  • Разработка новых и улучшение существующих ML моделей
  • Внедрение ML моделей в production (совместно с коллегами из отдела разработки)
  • Настройка мониторинга метрик качества, работоспособности моделей
  • Оценка качества работы ML моделей и полученных бизнес-эффектов

Требования:

  • Опыт разработки рекомендательных систем от 1 года
  • Опыт работы с Python DS стеком (Numpy, Pandas, Sklearn, LightGBM/ XGBoost, Matplotlib/ Seaborn)
  • Знание базового NLP (Bag of Words, TF-IDF, Word2Vec)
  • Знание математической статистики (проверка стат. гипотез)
  • Умение писать код понятный другим людям, с соблюдением code style, готовность проходить и проводить code review
  • Опыт работы с Linux, Git, Docker
  • Опыт работы с одной или несколькими базами данных (ClickHouse, PostgreSQL, MySQL, MongoDB) написания SQL запросов
  • Готовность изучать и применять на практике новые инструменты и технологии

Будет плюсом:

  • Опыт внедрения ML моделей в production
  • Опыт планирования и проведения A/B экспериментов
  • Опыт разработки python API на Django / Flask/ FastAPI
  • Знание / опыт с инструментами Airflow, MLflow, DVC
  • Знание / опыт с DL фреймворками Pytorch / Tensorflow
  • Знание / опыт с Spark (PySpark / Scala), Spark ML / MLlib

Условия работы:

  • Knowledge sharing и профессиональный рост
  • Возможность принимать участие в конференциях и проходить обучение
  • ДМС после испытательного срока
  • Доплаты по больничному листы (до 15 дней в году)
  • Трудоустройство по ТК РФ
  • Возможность работать удаленно или в московском офисе на м. Маяковская, SOK Сады Пекина

Адрес на карте