Специалист по обработке и анализу данных (Middle Data Scientist)

от 190000 руб.

Гознак
Москва, Мытная улица, 19
Шаболовская
временноe трудоустройство, Полный день, От 1 года до 3 лет, Полная занятость, Стандарт

Ключевые навыки

Python
Математическая статистика
Математическое моделирование
C/C++
Data Science
Computer Vision
Natural Language Processing
Time Series Analysis
PostgreSQL
Системный анализ
Информационные технологии
Linux
Data Mining
SQL

Специальные/ профессиональные знания и навыки в области:

• хорошее знание: линейной алгебры, аналитической геометрии, математического анализа, теории вероятностей, математической статистики и численных методов,

• знание алгоритмов и структур данных,

• знание Python, С/С++ и SQL, достаточное для решения собственных задач,

• умение структурировано, просто и понятно излагать мысли,

• опыт построения моделей (классификационных, регрессионных и кластеризационных) используя ML\DL подходы и инструменты,

• опыт многомерного анализа (кластерный, факторный анализ, методы главных компонент и опорных векторов), проверки статистических гипотез, построения временных рядов,

• оценка качества полученных моделей,

• интерпретация и визуализация результатов работы полученных моделей,

• опыт работы в одной из предметных областей: биометрия, антиспуфинг, машинное зрение, обработка текста, рекомендательные системы от 2 лет,

• опыт работы в области компьютерного зрения\обработки изображений от 1 года,

• уверенное использование фреймворков\библиотек: PyTorch, Tensorflow, Keras, Caffe, Pandas, Numpy, Scipy, Scikit-learn, XGBoost, CatBoost и т.д.),

• наличие успешно пройденных курсов по ML\DL & Computer Vision,

• наличие практического опыта использования Linux\Unix.

  • Необходимые деловые/личностные качества:

    Аналитический склад ума, быстрая обучаемость, умение работать с большими объемами информации, стрессоустойчивость, системный подход, командный игрок и нацеленность на результат.

  • будет плюсом:

    - знание основных подходов интеграции информационных систем,

    - наличие практического опыта использования OpenCV, Dlib и Dask

    - знание, понимание и использование: REST API, Flask, Docker и Kubernetes,

    - знание современных подходов и методологии управления проектами (Scrum и Kanban).

    • ссылки на свои проекты, приветствуются (GitHub и т.д.).

Обязанности:

- участие в сборе бизнес-требований, формирование идей,

- участие в проработке решения задачи в составе рабочих групп,

- поиск и сбор неструктурированных данных для dataset,

- оценка качества dataset, подготовка для машинного обучения,

- подбор методов анализа данных, алгоритмов машинного обучения и оптимизации,

- построение гипотез и предположений об оптимизации и повышении эффективности моделей,

- работа в средах программных продуктов BigData (Hadoop: Spark и Hive),

- построение и проверка прогнозных, классификационных, кластеризационных моделей, использование методов машинного обучения и математической оптимизации,

- оценка качества разработанных моделей,

- тестирование обученных моделей,

- предоставление обратной связи о сроках и текущем статусе задачи/проекта,

- участие в адаптации и выводе в продуктивное использование реализованных моделей,

- подготовка, согласование и актуализация технической документации(техническое задание, сценарий использования, пояснительная записка, обучающие материалы, инструкции, руководства пользователей и т.д.).

Требования:
  • Образование (уровень и профиль): образование высшее (факультеты: математики, информационных технологий или физики)

Адрес на карте