Специалист по обработке и анализу данных (Middle Data Scientist)
Москва, Мытная улица, 19
Ключевые навыки
Специальные/ профессиональные знания и навыки в области:
• хорошее знание: линейной алгебры, аналитической геометрии, математического анализа, теории вероятностей, математической статистики и численных методов,
• знание алгоритмов и структур данных,
• знание Python, С/С++ и SQL, достаточное для решения собственных задач,
• умение структурировано, просто и понятно излагать мысли,
• опыт построения моделей (классификационных, регрессионных и кластеризационных) используя ML\DL подходы и инструменты,
• опыт многомерного анализа (кластерный, факторный анализ, методы главных компонент и опорных векторов), проверки статистических гипотез, построения временных рядов,
• оценка качества полученных моделей,
• интерпретация и визуализация результатов работы полученных моделей,
• опыт работы в одной из предметных областей: биометрия, антиспуфинг, машинное зрение, обработка текста, рекомендательные системы от 2 лет,
• опыт работы в области компьютерного зрения\обработки изображений от 1 года,
• уверенное использование фреймворков\библиотек: PyTorch, Tensorflow, Keras, Caffe, Pandas, Numpy, Scipy, Scikit-learn, XGBoost, CatBoost и т.д.),
• наличие успешно пройденных курсов по ML\DL & Computer Vision,
• наличие практического опыта использования Linux\Unix.
-
Необходимые деловые/личностные качества:
Аналитический склад ума, быстрая обучаемость, умение работать с большими объемами информации, стрессоустойчивость, системный подход, командный игрок и нацеленность на результат.
-
будет плюсом:
- знание основных подходов интеграции информационных систем,
- наличие практического опыта использования OpenCV, Dlib и Dask
- знание, понимание и использование: REST API, Flask, Docker и Kubernetes,
- знание современных подходов и методологии управления проектами (Scrum и Kanban).
• ссылки на свои проекты, приветствуются (GitHub и т.д.).
Обязанности:
- участие в сборе бизнес-требований, формирование идей,
- участие в проработке решения задачи в составе рабочих групп,
- поиск и сбор неструктурированных данных для dataset,
- оценка качества dataset, подготовка для машинного обучения,
- подбор методов анализа данных, алгоритмов машинного обучения и оптимизации,
- построение гипотез и предположений об оптимизации и повышении эффективности моделей,
- работа в средах программных продуктов BigData (Hadoop: Spark и Hive),
- построение и проверка прогнозных, классификационных, кластеризационных моделей, использование методов машинного обучения и математической оптимизации,
- оценка качества разработанных моделей,
- тестирование обученных моделей,
- предоставление обратной связи о сроках и текущем статусе задачи/проекта,
- участие в адаптации и выводе в продуктивное использование реализованных моделей,
- подготовка, согласование и актуализация технической документации(техническое задание, сценарий использования, пояснительная записка, обучающие материалы, инструкции, руководства пользователей и т.д.).
Требования:-
Образование (уровень и профиль): образование высшее (факультеты: математики, информационных технологий или физики)