Data Scientist (middle)
Газпром-медиа Развлекательное телевидение (ГПМ РТВ)
Москва, Большая Садовая улица, 5к1
Москва, Большая Садовая улица, 5к1
Маяковская
Полный день, От 3 до 6 лет, Полная занятость, Стандарт
Ключевые навыки
Python
Git
PostgreSQL
Django Framework
Django
Linux
Docker
Кого ищем: Middle Data Scientist с уклоном в рекомендательные системы в Департамент Управления Данными (ДУД) компании Uma.Tech (входит в холдинг “Газпром-медиа”).
О команде:
ДУД отвечает за централизованный сбор, хранение, обработку и анализ данных из всевозможных источников холдинга, создание новых продуктов на основе данных. ДУД состоит из команд разработки, тестирования, эксплуатации, продуктовых аналитиков и специалистов по анализу данных (DS).
Проекты:
- Рекомендательные системы видео и текстового контента на сайте спортивных новостей Matchtv.ru
- Рекомендательные системы видеоконтента на сайте онлайн-кинотеатра Premier.one
Используемые в проектах технологии:
- Python: ML стек, Django, Celery
- ClickHouse, PostgreSQL, Redis, Kafka
- Scala, Spark, Spark ML, Ignite, Spring
- CI/ CD: Docker, Gitlab-ci, Kubernetes
Задачи:
- Генерация и проверка гипотез (сбор, анализ, визуализация данных и результатов работы моделей)
- Подготовка наборов данных, разработка регулярных пайплайнов сбора данных
- Разработка новых и улучшение существующих ML моделей
- Внедрение ML моделей в production (совместно с коллегами из отдела разработки)
- Настройка мониторинга метрик качества, работоспособности моделей
- Оценка качества работы ML моделей и полученных бизнес-эффектов
Требования:
- Опыт разработки рекомендательных систем от 1 года
- Опыт работы с Python DS стеком (Numpy, Pandas, Sklearn, LightGBM/ XGBoost, Matplotlib/ Seaborn)
- Знание базового NLP (Bag of Words, TF-IDF, Word2Vec)
- Знание математической статистики (проверка стат. гипотез)
- Умение писать код понятный другим людям, с соблюдением code style, готовность проходить и проводить code review
- Опыт работы с Linux, Git, Docker
- Опыт работы с одной или несколькими базами данных (ClickHouse, PostgreSQL, MySQL, MongoDB) написания SQL запросов
- Готовность изучать и применять на практике новые инструменты и технологии
Будет плюсом:
- Опыт внедрения ML моделей в production
- Опыт планирования и проведения A/B экспериментов
- Опыт разработки python API на Django / Flask/ FastAPI
- Знание / опыт с инструментами Airflow, MLflow, DVC
- Знание / опыт с DL фреймворками Pytorch / Tensorflow
- Знание / опыт с Spark (PySpark / Scala), Spark ML / MLlib
Условия работы:
- Knowledge sharing и профессиональный рост
- Возможность принимать участие в конференциях и проходить обучение
- ДМС после испытательного срока
- Доплаты по больничному листы (до 15 дней в году)
- Трудоустройство по ТК РФ
- Возможность работать удаленно или в московском офисе на м. Маяковская, SOK Сады Пекина