Инженер ML-разработки (Pydata)

З/п не указана
Опыт работы: От 1 года до 3 лет
График работы: Полный день
Занятость: Полная занятость
Компания: Газпром-медиа Развлекательное телевидение (ГПМ РТВ)

Мы ищем инженера ML-разработки (Pydata) в департамент управления данными.

Задача департамента – централизованный сбор, хранение, обработка и анализ данных из всевозможных источников холдинга, с использованием передовых open-source технологий, внедрение data-driven культуры, модернизация текущих, и создание новых продуктов на основе данных.

ОБЯЗАННОСТИ
  • оптимизация существующих моделей
  • разработка высоконагруженных web-сервисов на базе моделей из прототипов, предоставленных Data Analysts / Data Scientists или найденных самостоятельно из публикаций
  • подготовка наборов данных из исходных, загруженных ETL-процессом и поддержка ETL-процессов совместно с Data Engineers
  • разработка и поддержка чеков полноты данных для статистического анализа и машинного обучения
  • поддержание высокого уровня культуры написания и тестирования кода
  • контроль за CI / CD приложений платформы, помощь в реагировании на инциденты
  • настройка мониторинга метрик качества моделей
ТРЕБОВАНИЯ
  • опыт разработки ПО от 2 лет
  • поверхностное знание Python Django
  • со стеком PyData (Numpy, Scipy, Sklearn, Pandas / Xarray)
  • в создании и обучении моделей рекомендательных систем
  • опыт работы с Bash, вкл. знание git, sed, awk, find, grep
  • опыт документирования, а также владение техническим английским (B1)
  • понимание ООП, знание основных шаблонов проектирования приложений (GoF)
  • опыт работы с исп. RDBMS и SQL-запросов
  • опыт работы с брокерами сообщений Kafka / RabbitMQ
  • опыт работы с хранилищами Redis
ПРИВЕТСТВУЕТСЯ
  • опыт работы с хранилищем данных ClickHouse
  • наличие оконченных курсов AI, ML на Coursera (MIPT / HSE / Andrew Ng и подобные)
  • опыт разработки с исп. GD, DT (xgboost, catboost и пр.), NLP (gensim, nltk, pymystem)
  • опыт проверки статистических гипотез
  • опыт интерпретации качества полученных моделей
  • опыт работы с приложениями Jupyter Notebook / Zeppelin Notebook
  • opensource contribution / pet projects со ссылками на BitBucket / GitHub / GitLab / архивом
  • опыт проведения code review, cледование code style
Мы предлагаем:
  • Knowledge sharing (у нас очень хорошая команда)
  • Профессиональный рост
  • ДМС после испытательного срока
  • Доплаты по больничному листы (до 15 дней в году)
  • Трудоустройство по ТК РФ
  • Поддержка важных жизненных событий
  • Возможность работать удаленно или в Московском офисе на Маяковской, SOK Сады Пекина
Хочу откликнуться
<
>