Senior ML engineer (ML on Code domain)

З/п не указана
Опыт работы: Более 6 лет
График работы: Полный день
Занятость: Полная занятость
Компания: Samsung Research Russia
Краткое описание проекта:

Наша команда занимается разработкой инструментов анализа и модификации кода на основе машинного обучения. Данный проект фокусируется на следующих задачах: генерация unit тестов, генерация комментариев для кода, обнаружение и исправление ошибок в коде.

Описание задач:

Исследование и разработка инструментов для разработчиков программ, которые автоматизируют рутинные задачи и упрощают процесс разработки в компании. Дообучение уже имеющихся NLP моделей для задач анализа кода, сбор и повышение качество датасета на основе открытых источников кодовой базы

Обязательные требования​​​​​​​:
  • Опыт работы с NLP моделями и техниками (Transformers, Embeddings, Tokenization Schemes)
  • Опыт работы с одним из DL фреймворков (e.g., PyTorch, Caffe2, TensorFlow, Keras, Chainer), которое включает постановку задачи, обучение моделей и анализ разработанных алгоритмов
  • Уверенное знание языка программирования Python
  • Знание и понимание основных практик разработки программного обеспечения: ревью кода, использование системы контроля версий, тестирование и сопровождение кода и другие.
  • Опыт написания и публикации научных статей по релевантным темам в научные журналы, выступление на международных конференциях
Дополнительные требования:
  • Опыт методик оптимизации нейронных такие как квантизация, pruning, сжатие весов, sparsification и другие.
  • Опыт работы с генеративно-состязательными сетями
  • Опыт работы с такими платформами как FAISS, FAIRseq и другими.
  • Опыт разработки на языках программирования C/C++/Java
  • Кандидат физико-математических или технических наук (в области анализа программного кода, машинного обучения или смежных областей)
Стек технологий:Tensorflow / Pytorch, HuggingFace, Google Colab, Transformer models
Хочу откликнуться
<
>