Data Scientist (middle)

З/п не указана
Опыт работы: От 3 до 6 лет
График работы: Полный день
Занятость: Полная занятость
Компания: Газпром-медиа Развлекательное телевидение (ГПМ РТВ)
Кого ищем: Middle Data Scientist на рекомендательные системы в Департамент
Управления Данными (ДУД) компании Uma.Tech (входит в холдинг “Газпром-медиа”)

О команде:ДУД отвечает за централизованный сбор, хранение, обработку и анализ данных из
всевозможных источников холдинга, создание новых продуктов на основе данных. ДУД
состоит из команд разработки, тестирования, эксплуатации, продуктовых аналитиков и
специалистов по анализу данных (DS)

Проекты:● Рекомендательные системы видео и текстового контента на сайте спортивных
новостей Matchtv.ru
● Рекомендательные системы видеоконтента на сайте онлайн-кинотеатра
Premier.one

Используемые в проектах технологии:● Python: ML стек, Django, Celery
● Scala, Spark, Spark ML, Ignite, Spring
● ClickHouse, PostgreSQL, Redis, Kafka
● CI/ CD: Docker, Gitlab-ci, Kubernetes

Задачи: Основная задача: улучшение существующих и разработка новых моделей
рекомендаций контента. Подробнее:
  • Генерация и проверка гипотез (сбор, анализ, визуализация данных и результатов работы моделей)
  • Подготовка наборов данных, разработка регулярных пайплайнов сбора данных (разрабатываем свой инструмент для оркестрации джоб и пайплайнов на Django + Celery)
  • Развитие существующих и создание новых моделей рекомендаций, разработка
    прототипов на python (по желанию возможно на scala)
  • Внедрение разработанных прототипов (сервисов) в production (совместно с
    коллегами из отдела разработки)
  • Планирование, проведение и анализ АБ-тестов (разрабатываем свой
    инструмент для АБ-тестирования)
  • Мониторинг оффлайн и онлайн метрик качества, работоспособности моделей,
    оценка полученных бизнес-эффектов
Требования:
  • Опыт работы с Python DS стеком (Numpy, Pandas, Sklearn, LightGBM/ XGBoost,
    Matplotlib/ Seaborn)
  • Знание базового NLP (Bag of Words, TF-IDF, Word2Vec)
  • Знание математической статистики (проверка стат. гипотез)
  • Умение писать код понятный другим людям, с соблюдением code style,
    готовность проходить и проводить code review
  • Опыт работы с Linux, Git, Docker
  • Опыт работы с одной или несколькими базами данных (ClickHouse, PostgreSQL, MySQL, MongoDB) написания SQL запросов
Будет плюсом:
  • Опыт в рекомендательных системах / ранжировании / поиске
  • Опыт внедрения ML моделей в production
  • Опыт планирования, проведения и анализа A/B экспериментов
  • Опыт разработки веб-сервисов на python (Django / Flask/ FastAPI ...)
  • Знание / опыт с инструментами Airflow, MLflow, DVC
  • Знание / опыт с DL фреймворками Pytorch / Tensorflow
  • Знание / опыт с Spark (PySpark / Scala), Spark ML / MLlib
  • Примеры кода / pet projects / open source contribution / kaggle на GitHub/ GitLab/
    BitBucket
Условия работы:
  • Knowledge sharing и профессиональный рост
  • Возможность принимать участие в конференциях и проходить обучение
  • ДМС со стоматологией после испытательного срока
  • Доплаты по больничному листу (до 15 дней в году)
  • Трудоустройство по ТК РФ
  • Возможность работать удаленно или в московском офисе на м. Маяковская, SOK Сады Пекина
Хочу откликнуться
<
>