Machine Learning Engineer на Computer Vision направление

З/п не указана
Опыт работы: От 3 до 6 лет
График работы: Полный день
Занятость: Полная занятость
Компания: Газпром-медиа Развлекательное телевидение (ГПМ РТВ)
Кого ищем: Machine Learning Engineer (Middle/Senior) на Computer Vision направление

О команде: ДУД отвечает за централизованный сбор, хранение, обработку и анализ данных из всевозможных источников холдинга, создание новых продуктов на основе данных. ДУД состоит из команд разработки, тестирования, эксплуатации, продуктовых аналитиков и специалистов по анализу данных (DS).

Проект: Система разметки архивных видео для телеканалов (десятки тысяч часов)

Задачи:
  • Построение системы быстрого поиска контента в видео по тегам

  • Разработка высоконагруженных end-to-end web-сервисов на базе ML-моделей из прототипов, предоставленных DS/DL-командами; плюс к этому умение разработать базовые ML-модели и бейзлайны, взятые из туториалов или пейперов, при отсутствии прототипов

  • Построение DAGов

  • Оптимизация существующих web-сервисов и ML-моделей внутри них

  • автоматизация ETL-процессов сбора данных для ML-сервисов (самостоятельно и совместно с DE)

  • Разработка и поддержка чеков полноты данных для статистического анализа и машинного обучения

  • Контроль за CI/CD приложений, помощь в реагировании на инциденты

  • Настройка мониторинга метрик качества моделей

  • Поддержание высокого уровня культуры написания и тестирования кода

Требования:
  • Опыт разработки ПО от 2 лет

  • Опыт внедрения ML моделей в продакшен

  • Pipeline-friendly - опыт выстраивания многостадийных DAGов - Airflow, MLFlow, DVC

  • Data-search-friendly - опыт с системами быстрого поиска контента Faiss/Annoy/NMSLIB/Milvus

  • Web-friendly: понимание основных частей, из которых состоит web-приложение, опыт с Celery, поверхностное знание Python Django или опыт с аналогичными фреймворками (Flask/FastAPI/Java Spring)

  • Dl-friendly: знание фреймворков для deep learning (PyTorch, TensorFlow)

  • Dl-inference-friendly: знание стека для оборачивания DL моделей в inference мод (ONNX, TensorRT)

  • Ml-friendly: знание python-стека, Numpy, Scipy, Sklearn, Pandas, XGBoost/CatBoost

  • Database-friendly: опыт с одной или несколькими RDBMS/NoSQL/Key-Value (PostgreSQL, ClickHouse, Redis/Ignite), написание SQL-запросов

  • Broker-friendly: опыт с Kafka/RabbitMQ

  • Docker-friendly: базовое понимание работы с контейнерами

  • Unix-friendly: bash, sed, awk, find, grep, ssh

  • Ggit-friendly: знание git, командная работа с репозиторием, понимание различных workflows

  • Gof-friendly: понимание ООП, знание основных шаблонов проектирования приложений

  • People-friendly: культура документирования своих решений\кода, соблюдение codestyle, code review

Условия:
  • Knowledge sharing и профессиональный рост
  • Возможность принимать участие в конференциях и проходить обучение
  • ДМС со стоматологией после испытательного срока
  • Доплаты по больничному листу (до 15 дней в году)
  • Трудоустройство по ТК РФ
  • Возможность работать удаленно или в московском офисе на м. Маяковская, SOK Сады Пекина
Хочу откликнуться
<
>