Senior Data Scientist

до 300 000 руб. на руки
Опыт работы: От 3 до 6 лет
График работы: Полный день
Занятость: Полная занятость
Компания: Digital Reputation

В команду продукта по информационной безопасности публичных персон (входящих как в российский, так и в мировой список Forbes) и организаций требуется опытный Senior Data Scientist. Мы ожидаем от кандидата высокую экспертизу в Natural Language Processing и настроены взять в команду ответственного специалиста, который сможет решать продуктовые задачи на всех этапах: от идеи и постановки задачи до промышленного внедрения и обработки обратной связи.

Обязанности на проекте:

Исследования:

  • Постановка задач машинного обучения на основе бизнес-требований заказчика, исследование известных подходов к решению, разработка собственного решения;
  • Формирование требований к данным, сбор и подготовка данных, инструктирование разметчиков на аутсорсе или краудсорсинговых платформах, проверка размеченных датасетов на корректность и полноту;
  • Подготовка данных, отбор аномальных сэмплов, feature selection and engineering.
  • Изучение материалов (научные статьи, книги, блоги и тд) по машинному обучению и computer science, тестирование и внедрение перспективных методов;
  • Разработка и тестирование алгоритмов машинного обучения: прототипирование, обучение моделей, оценка качества, интерпретация результата, внедрение в продакшн;

Разработка:

  • Работа с базами данных: написание и оптимизация запросов, индексирование, модификации в структуре БД;
  • Написание кода в продакшн;
  • Разработка взаимодействия МЛ части с остальными сервисами проекта;
  • Поддержка стабильной работы МЛ сервиса: контроль над серверами, развитие систем мониторинга и логгирования, работа над отказоустойчивостью и масштабированием;

Операционные задачи:

  • Документирование алгоритмов и исходного кода;
  • Регулярное составление планов и ведение отчетности по текущим результатам;
  • Техническое развитие проекта, своевременная модернизация технологического стека;
  • Оптимизация и совершенствование текущего решения под новые бизнес-требования;
Примеры задач:
  • Развитие модели, определяющей тональность публикаций в сми и социальных сетях;
  • Исследование и разработка модели тематического моделирования (например PLSA, LDA, DSSM, transformer based clustering и тд.);
  • Построение алгоритма распознавания действующих лиц в тексте (named entity recognition, entity linking).

Знание и опыт, которые потребуются:

  • Высшее техническое/математическое образование;
  • Опыт построения и внедрения моделей машинного обучения и алгоритмов обработки данных в продакшн;
  • Сильная теоретическая подготовка в ML: классические алгоритмы ML, архитектуры нейронных сетей (CNN, RNN, LSTM, Transformer, etc.);
  • Опыт решения прикладных задач в области Natural Language Processing будет преимуществом;
  • Хороший уровень владения математическим анализом, теорией вероятностей и линейной алгеброй;
  • Опыт разработки на python (pytorch, numpy, sklearn);
  • Опыт работы с базами данных: PostgreSQL, S3, MongoDB и т. д. будет преимуществом;
  • Опыт разработки микросервисных архитектур будет преимуществом;
  • Стремление к постоянному самообучению и решению сложных задач;
  • Умение и желание решать задачи в составе кросс-функциональной команды.
Мы предлагаем:
  • Профессиональное развитие на основе возможности вести разработку уникальных востребованных продуктов;
  • Возможность формировать и вести команду data scientist с ростом портфеля продуктов;
  • Атмосферу стартапа с высоким уровнем свободы и доверия;
  • Креативный офис в центре Москвы вблизи метро Арбатская;
  • Компенсация обучения на образовательных платформах;
  • Лекции и творческие вечера в лектории офиса.
Хочу откликнуться
<
>