Бесплатный митап для ML-инженеров от конференции IML и ecom.tech. В Санкт-Петербурге и онлайн.
В программе доклады про основные этапы работы над ML-моделями для прогнозирования и поиска.
После каждого доклада — Q&A-сессия, где вы сможете задать вопросы спикерам.
ℹ️ О чем доклад:
Прогнозирование необходимо для тысяч дарксторов, чтобы ежедневно распределять курьеров по сменам.
Для новых дарксторов (без исторических данных) нужно оценить потенциальный спрос и спланировать количество курьеров на первые дни работы, учитывая сезонные тренды.
В докладе разберем:
— Подход к разработке основной модели прогнозирования заказов;
— Подбор признаков и адаптацию моделей под характеристики даркстора;
— Prophet vs. CatBoost для основной модели и новых точек;
— CatBoost и KNN для планируемых дарксторов;
— Учет дополнительных факторов: промо, маркетинговые активности и закупки.
Спикер: Анастасия Левашова, специалист по машинному обучению, ecom.tech. Занимается разработкой и улучшением моделей прогноза, исследованиями и аналитикой по работе модели.
ℹ️ О чем доклад:
Главные проблемы в разметке данных для обучения ML в маркетплейсе — холодный старт, большой объем данных и сжатые сроки. Сравним ручную разметку (внешнюю и внутреннюю), автоматизированные методы (DL, эмбеддеры, реранкеры, LLM) и их комбинации. Увидим результаты и итоговую оптимизацию.
Ключевые аспекты:
— Задача — поиск синонимов и опечаток, категоризация запросов, рекомендация новых товаров.
— Оптимизация разметки с LLM, эмбеддерами и реранкерами.
— Комбинированный подход (LLM + эмбеддер), ускоривший разметку в 3+ раза и снизивший стоимость в 10+ раз.
Спикер: Василий Висков, старший специалист по Data Science, ecom.tech. Занимается автоматическим выявлением проблем поиска и построением текстовых векторных моделей ранжирования и отбора кандидатов.
ℹ️ О чем доклад:
Пользователи всё чаще предпочитают текстовый поиск ручным фильтрам. Например, вместо скролла и чекбоксов можно написать «Хочу квартиру в Москве с зеленым диваном в стиле лофт» — и получить подборку.
В Циан-помощнике добавили поиск по описанию фото, совместив его с классическими фильтрами.
Но как научить бота «видеть» объявления и находить любые объекты по фото? В докладе разберем:
— Как CLIP-модель позволяет искать по тексту без лейблов;
— Как устроен векторный поиск в Qdrant;
— Как работает система фильтрации для точной выдачи.
Доклад будет полезен ML-инженерам, MLOps-специалистам и всем, кто интересуется CLIP и векторными базами данных.
Технологии: NLP, CV, LLM, CLIP, Qdrant, векторный поиск, эмбеддинги.
Спикер: Ирина Говорова, Циан. Занимается машинным обучением более 3 лет. Имеет большой опыт разработки рекомендательных систем и обучения ранжирующих моделей. Сейчас работает над чат-ботом Циан-помощником для поиска недвижимости и консультации пользователей по объявлениям.
Санкт-Петербург
БЦ Лангензипен, ул. Малая Монетная, 2 лит Г
Показать на карте
Уже есть билет
Восстановить
Напоминаем, что для того чтобы восстановить билет организатору можно не писать.
Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.