Чем сложны LLM
Обсуждаем языковые модели, сдвиг парадигм в ML и челленджи, с которыми столкнулись при создании GigaChat от Сбера. От растущих требований к железу до встраивания LLM в экосистему.
Итак, вы разработали модель ML. Как измерить ее полезность? Какую развернуть инфраструктуру? Как масштабировать систему и сделать ее устойчивой? Нужно ли строить свою ML-платформу? Участвуйте в конференции I’ML, чтобы найти ответы на эти вопросы и обсудить работу MLOps.
Зададимся вопросами инфраструктуры, инструментов и специфики MLOps — без конкретных кейсов, но с лучшими практиками из разных доменов. Обсудим формирование датасетов, эксперименты и создание новых фич, workflow и мониторинг моделей, настройку железа, софта и сетевых взаимодействий. И, конечно, процессы и культуру в ML-команде.
Организатор конференции — JUG Ru Group.
Обсуждаем языковые модели, сдвиг парадигм в ML и челленджи, с которыми столкнулись при создании GigaChat от Сбера. От растущих требований к железу до встраивания LLM в экосистему.
Говорим про типы данных, с помощью которых модель учится понимать мир. Разбираемся в истории появления мультимодальных моделей и сравниваем их с нейронными сетями внутри человека.
Обсуждаем ML-инфраструктуру, включая MLOps. Как устроен этот процесс в компаниях разного уровня зрелости, как выводить модели в прод быстро и переиспользовать код. Как выглядит ML-платформа и кому лучше заниматься ее построением.
Продолжаем говорить о доставке моделей в прод. На этот раз — о задачах, с которыми сталкивается компания на всех этапах. Про датасеты, обучение моделей и пайплайны.
Разрабатываем модели на Big Data, отправляем их в прод и мерджим LLM.
Говорим о том, как менялась практика оценки NLP-моделей, обсуждаем влияние кодогенерации на бизнес и жизнь разработчика. Поднимаем вопросы о доверии к профессионалам и роли людей в создании новых метрик.
Существует множество проверенных архитектур для ранжирования. В этом выпуске изучаем их эффективность и обсуждаем, как сделать удобную инфраструктуру — вместе с Head of ML в Wildberries.
Разбираемся, что такое ML System Design Document — когда его внедрять, кто должен этим заниматься, и что вообще подразумевается под System Design для ML-специфики.
Всё о специфике ML в логистике — объем и доступность данных, создание и тестирование алгоритмов для срочной и плановой доставки, реальные бизнес-процессы и прогнозирование заказов.
Обсуждаем AutoML и области его применения в банках: от распознавания документов до торговли на биржах. Рассматриваем Python-библиотеки для задач AutoML.
Рассматриваем задачи Computer Vision на примере детекции драк. Проводим мысленный эксперимент с пет-проектами вселенского масштаба. Обсуждаем жизнь CV-инженера — от простого сотрудника до руководителя команды и директора, влияющего на бизнес.
Разбираем главные тренды медиапространства вместе с редакторами каналов по ML и DS. ML-продукты, исследования, робототехника, новые индустрии, регуляция AI и направления работы корпораций и стартапов.