Разработчик AI-продуктов в Яндекс Плюс Фантех

З/п не указана
Опыт работы: От 3 до 6 лет
График работы: Полный день
Занятость: Полная занятость
Компания: Яндекс

Мы занимаемся анализом и разметкой контента, работаем с ML-моделями и Яндекс Заданиями, внедряем Алису в новые продукты, боремся с пиратами. Ищем человека, который поможет нам внедрять передовые AI-модели в работу с контентом и персонализацией и выводить пользовательский опыт на новый уровень.

В этом году мы хотим, чтобы сервисы Фантеха обрели полноценный AI-слой и начали давать пользователям новый, «магический» опыт: персональные советы и аргументы, объясняющие, почему именно этот продукт, сервис или контент может быть интересен конкретному человеку, предлагать умных ассистентов внутри интерфейсов и автоматические рекапы сложного видеоконтента. Для этого мы будем запускать новые AI-проекты на стыке CV, VLM, тематических AI-агентов и генеративных пайплайнов на базе LLM с обогащением персональными и сервисными данными, а также развивать более глубокое понимание видео. Ваша задача — помогать придумывать такие фичи и доводить их от быстрых экспериментов до надёжных продакшен-решений.

На пути от любой красивой технологии до реального продукта стоит множество инженерных задач: подготовка и поставка данных, оптимизация вычислений, автоматизация шагов, которые были сделаны вручную на этапе прототипирования, использование human-in-the-loop. Мы ищем разработчика, который поможет доводить технологии до продакшена, обеспечивать их безотказную работу и масштабирование, развивать технологическую и инфраструктурную составляющие.

Обязанности:
  • Работа с мультимодальными даннымиВам предстоит обрабатывать тексты, картинки и аудио, используя как передовые платные и бесплатные модели, так и внутренние разработки Яндекса.
  • Эксперименты и прототипирование

    Вы будете проектировать быстрые эксперименты под MVP: подбирать подходящие опенсорсные решения, тестировать их, анализировать результаты и на основе выводов прорабатывать пути масштабирования. Важно быть в курсе актуальных подходов и адаптировать их под наши задачи.

  • Дообучение и адаптация моделейИногда нужно будет дообучать существующие модели на наших данных под конкретные бизнес-задачи. В фокусе — построение офлайн-пайплайнов для обработки больших объёмов данных; периодически будут возникать real-time-проекты, где ключевыми требованиями станут эффективность и устойчивость решений.

Мы ждем, что вы:
  • Знаете алгоритмы и структуры данных
  • Умеете писать код хорошего уровня на Python
  • Разбираетесь в MapReduce и SQL
  • Можете самостоятельно общаться с менеджерами-заказчиками, формулировать технические требования и проектировать архитектуру доставки данных вместе с разработчиками смежных компонентов
Будет плюсом, если вы:
  • Активно интересуетесь развитием и применением нейросетей
  • Использовали различные LLM и VLM в работе или делали пет-проекты с их применением
  • Любите кино, музыку и книги так же сильно, как и мы
Хочу откликнуться
<
>