ML для видеоконференций SberJazz: deep dive в разработку моделей замены фона

Расскажем, как разрабатывали модели замены фона для платформы видеоконференций SberJazz.

Перед нами стояла амбициозная задача: ощутимо улучшить качество моделей по сравнению с доступными открытыми решениями, будучи существенно ограниченными в вычислительных ресурсах из-за необходимости запускать модели в веб-браузерах на обычных ноутбуках наших пользователей.

Пройдемся по основному сетапу обучения моделей сегментации человека: как мы выбирали архитектуры, какие брали данные для обучения и зачем собирали свои, что использовали для аугментации данных, к каким метрикам для оценки качества моделей пришли. Потом пройдемся по вопросу оптимизации моделей: за счет чего мы уменьшили архитектуру, не теряя качество; какие результаты получили, применяя такие общеизвестные подходы, как дистилляция, прунинг и квантизация моделей.

В конце обсудим очень важный для продуктового применения технологии аспект — постобработку сегментационных масок моделей для повышения качества и стабильности работы эффекта.

Спикеры

Дмитрий Балиев
SberDevices
Давид Нурдинов
SberDevices

Другие доклады по теме «CV»
- Смотреть запись
  Компьютерное зрение в Wildberries: поиск товара по фотографии и детекция «главного» объекта
  Степан Евстифеев
  Wildberries
- Смотреть запись
  Active Learning для нейросетей компьютерного зрения в складской робототехнике
  Aлександр Тимофеев-Каракозов
  Яндекс
- Смотреть запись
  Как Самолет PropTech трансформирует интерьеры
  Алексей Луговой
  Самолет

Расписание

ML для видеоконференций SberJazz: deep dive в разработку моделей замены фона

Спикеры

Другие доклады по теме «CV»