Стажер Data Engineer
Ключевые навыки
О проекте: разработка дата продуктов для различных бизнес подразделений компании от логистики до маркетинга.
Стек технологий: Spark, Airflow, Kafka, PostgreSQL, ML, CI/CD, Greenplum, NiFi, Clickhouse, Kubernetes, Git, БД: MS SQL Server, Oracle, PostgreSQL, MongoDB.
Основные задачи в команде:
-
Создавать и улучшать процессы обработки данных (NiFi, Airflow, SQL);
-
Оптимизировать запросы к данным (партицирование, индексы, дистрибьюция, ... );
-
Делать витрины (Greenplum, Clickhouse, ... );
-
Разбираться в зоопарке баз источников (MS SQL Server, Oracle, PostgreSQL, MongoDB, ... );
-
Принимать участие в архитектурных решениях;
-
Разрабатывать схемы подключения новых источников в DWH;
-
Разрабатывать процедуры формирования детального слоя данных и слоя витрин DWH;
-
Настроить алерты на качество данных.
Что мы ожидаем от кандидата:
-
Знание SQL;
-
Знание принципов работы БД;
-
Понимание принципов работы с хранилищами данных;
-
Понимание практик машинного обучения;
-
Желание обучаться и развиваться;
-
Python, Scala или Java будет большим плюсом.
В свою очередь мы предлагаем:
-
Работу в стабильной компании-лидере DIY рынка с уникальной корпоративной культурой;
-
Участие в конференциях вместе с нашей международной командой (Россия, Франция, Испания, Бразилия);
-
Возможности для профессионального развития и изучения иностранных языков;
-
Белую заработную плату и систему премирования;
-
Компенсацию питания.