Middle/Senior Python Data Engineer (Wind Team, remote)
Санкт-Петербург, Заставская улица, 22к2
Ключевые навыки
Semrush – продуктовая IT-компания. С 2008 года мы разрабатываем свою собственную онлайн-платформу для интернет-маркетологов, и у нас неплохо получается! Доказательством этому является премия WORLD’S BEST SEARCH SOFTWARE, которую мы получаем уже три года подряд. С помощью Semrush можно отслеживать эффективность сайта, оценивать положение продукта в сети, анализировать конкурентов и многое другое.
Сегодня нашим сервисом пользуются 7 000 000+ клиентов из Америки, Европы, Азии и Австралии, а над созданием трудятся более 1 000 человек по всему миру. С самого основания мы привержены своим фундаментальным ценностям: всегда отдавать приоритет людям, а не процессам, приспосабливаться к переменам, а не следовать строгому плану.
Команда Wind Team в поисках Middle/Senior Data Engineer со знанием Python на проект по созданию единого аналитического хранилища данных компании, а также модернизации текущего DWH с целью обеспечения соответствия современным требованиям и подходам по организации хранилищ данных корпоративного класса.
Перед нами стоит амбициозная задача по оптимизации подходов к хранению и построения потоков данных на уровне компании. Нам необходимо объединить данные из разных источников, грамотно организовать процессинг и хранение под потребности смежных подразделений (потребителей данных): Analytics, Data Scientists, Business Intelligence, Back Office и т.д. Это решение обосновано рядом основных причин, указанных в списке ниже:
- Повышение качества кода, сгорание техдолга
- Реализация задач по проекту DWH (Marketing, HR):
- Поддержка существующего функционала
- Создание новых интеграций с различными внутренними системами
- Участие в создании нового уникального хранилища на новых технологиях
Наш текущий стек технологий:
- Python 3.6+;
- MySQL/PostgreSQL/BigQuery;
- Cloud Composer Airflow;
- Docker, k8s, Google Cloud Platform;
- Kafka/PubSub.
Основные задачи:
- Проработка архитектуры и требований к нашему проекту от других команд;
- Разработка системы хранения данных;
- Разработка системы обработки данных;
- Миграция с текущей системы хранения и процессинга на новую.
Мы ждём от тебя:
- Опыт работы от 3х лет по направлению Data Engineering;
- Уверенное владение Python и SQL;
- Опыт сбора, обработки и преобразования данных;
- Умение грамотно выстраивать потоки данных;
- Понимание подходов по обеспечению Data Quality;
- Опыт работы с различными колоночными и строковыми СУБД. Знание их преимуществ и недостатков, в какой ситуации лучше использовать ту или иную;
- Желание и способность автоматизировать рутинные процессы;
- Опыт работы с GitLab CI, Docker, Google Cloud Platform.
Преимуществом будет:
- Опыт работы с микросервисной архитектурой;
- Опыт командной разработки;
- Опыт работы с высоконагруженными MPP СУБД;
- Опыт моделирования данных;
- Опыт работы со Streaming Processing.
Мы предлагаем:
- На данный момент наши сотрудники придерживаются формата “работа из дома“, а вообще СПб офис располагается совсем рядом со ст.м. Московские ворота (10 минут прогулочным шагом).
- Гибкое начало рабочего дня, которое подойдет как жаворонку, так и сове. Ты можешь начать день в период с 9:00 до 12:00.
- Agile-подход в работе (с удовольствием всему научим).
- Различные тренинги/онлайн-курсы/конференции/книги для прокачивания твоих hard- и soft-скиллов.
- Поддержка твоих спортивных увлечений и компенсация стоимости абонементов (зал/танцы/скалодромы и прочее на твой выбор).
- Занятия по английскому языку. Сейчас они проводятся в формате онлайн.
- Крутые вечеринки и корпоративы! Да, тоже в онлайн-режиме, но нам все равно весело:)