Опыт работы: От 3 до 6 лет
График работы: Полный день
Занятость: Полная занятость
Компания: Газпром-медиа Развлекательное телевидение (ГПМ РТВ)
Кого ищем: Middle Data Scientist на рекомендательные системы в Департамент
Управления Данными (ДУД) компании Uma.Tech (входит в холдинг “Газпром-медиа”)
О команде:ДУД отвечает за централизованный сбор, хранение, обработку и анализ данных из
всевозможных источников холдинга, создание новых продуктов на основе данных. ДУД
состоит из команд разработки, тестирования, эксплуатации, продуктовых аналитиков и
специалистов по анализу данных (DS)
Проекты:● Рекомендательные системы видео и текстового контента на сайте спортивных
новостей Matchtv.ru
● Рекомендательные системы видеоконтента на сайте онлайн-кинотеатра
Premier.one
Используемые в проектах технологии:● Python: ML стек, Django, Celery
● Scala, Spark, Spark ML, Ignite, Spring
● ClickHouse, PostgreSQL, Redis, Kafka
● CI/ CD: Docker, Gitlab-ci, Kubernetes
Задачи: Основная задача: улучшение существующих и разработка новых моделей
рекомендаций контента. Подробнее: - Генерация и проверка гипотез (сбор, анализ, визуализация данных и результатов работы моделей)
- Подготовка наборов данных, разработка регулярных пайплайнов сбора данных (разрабатываем свой инструмент для оркестрации джоб и пайплайнов на Django + Celery)
- Развитие существующих и создание новых моделей рекомендаций, разработка
прототипов на python (по желанию возможно на scala) - Внедрение разработанных прототипов (сервисов) в production (совместно с
коллегами из отдела разработки) - Планирование, проведение и анализ АБ-тестов (разрабатываем свой
инструмент для АБ-тестирования) - Мониторинг оффлайн и онлайн метрик качества, работоспособности моделей,
оценка полученных бизнес-эффектов
Требования: - Опыт работы с Python DS стеком (Numpy, Pandas, Sklearn, LightGBM/ XGBoost,
Matplotlib/ Seaborn) - Знание базового NLP (Bag of Words, TF-IDF, Word2Vec)
- Знание математической статистики (проверка стат. гипотез)
- Умение писать код понятный другим людям, с соблюдением code style,
готовность проходить и проводить code review - Опыт работы с Linux, Git, Docker
- Опыт работы с одной или несколькими базами данных (ClickHouse, PostgreSQL, MySQL, MongoDB) написания SQL запросов
Будет плюсом: - Опыт в рекомендательных системах / ранжировании / поиске
- Опыт внедрения ML моделей в production
- Опыт планирования, проведения и анализа A/B экспериментов
- Опыт разработки веб-сервисов на python (Django / Flask/ FastAPI ...)
- Знание / опыт с инструментами Airflow, MLflow, DVC
- Знание / опыт с DL фреймворками Pytorch / Tensorflow
- Знание / опыт с Spark (PySpark / Scala), Spark ML / MLlib
- Примеры кода / pet projects / open source contribution / kaggle на GitHub/ GitLab/
BitBucket
Условия работы: - Knowledge sharing и профессиональный рост
- Возможность принимать участие в конференциях и проходить обучение
- ДМС со стоматологией после испытательного срока
- Доплаты по больничному листу (до 15 дней в году)
- Трудоустройство по ТК РФ
- Возможность работать удаленно или в московском офисе на м. Маяковская, SOK Сады Пекина