Бесплатный митап для ML-инженеров от конференции IML и ecom.tech. В Санкт-Петербурге и онлайн.
В программе доклады про основные этапы работы над ML-моделями для прогнозирования и поиска.
После каждого доклада — Q&A-сессия, где вы сможете задать вопросы спикерам.
ℹ️ О чем доклад:
Прогнозирование необходимо для тысяч дарксторов, чтобы ежедневно распределять курьеров по сменам.
Для новых дарксторов (без исторических данных) нужно оценить потенциальный спрос и спланировать количество курьеров на первые дни работы, учитывая сезонные тренды.
В докладе разберем:
— Подход к разработке основной модели прогнозирования заказов;
— Подбор признаков и адаптацию моделей под характеристики даркстора;
— Prophet vs. CatBoost для основной модели и новых точек;
— CatBoost и KNN для планируемых дарксторов;
— Учет дополнительных факторов: промо, маркетинговые активности и закупки.
Спикер: Анастасия Левашова, специалист по машинному обучению, ecom.tech. Занимается разработкой и улучшением моделей прогноза, исследованиями и аналитикой по работе модели.
ℹ️ О чем доклад:
Главные проблемы в разметке данных для обучения ML в маркетплейсе — холодный старт, большой объем данных и сжатые сроки. Сравним ручную разметку (внешнюю и внутреннюю), автоматизированные методы (DL, эмбеддеры, реранкеры, LLM) и их комбинации. Увидим результаты и итоговую оптимизацию.
Ключевые аспекты:
— Задача — поиск синонимов и опечаток, категоризация запросов, рекомендация новых товаров.
— Оптимизация разметки с LLM, эмбеддерами и реранкерами.
— Комбинированный подход (LLM + эмбеддер), ускоривший разметку в 3+ раза и снизивший стоимость в 10+ раз.
Спикер: Василий Висков, старший специалист по Data Science, ecom.tech. Занимается автоматическим выявлением проблем поиска и построением текстовых векторных моделей ранжирования и отбора кандидатов.
ℹ️ О чем доклад:
Пользователи всё чаще предпочитают текстовый поиск ручным фильтрам. Например, вместо скролла и чекбоксов можно написать «Хочу квартиру в Москве с зеленым диваном в стиле лофт» — и получить подборку.
В Циан-помощнике добавили поиск по описанию фото, совместив его с классическими фильтрами.
Но как научить бота «видеть» объявления и находить любые объекты по фото? В докладе разберем:
— Как CLIP-модель позволяет искать по тексту без лейблов;
— Как устроен векторный поиск в Qdrant;
— Как работает система фильтрации для точной выдачи.
Доклад будет полезен ML-инженерам, MLOps-специалистам и всем, кто интересуется CLIP и векторными базами данных.
Технологии: NLP, CV, LLM, CLIP, Qdrant, векторный поиск, эмбеддинги.
Спикер: Ирина Говорова, Циан. Занимается машинным обучением более 3 лет. Имеет большой опыт разработки рекомендательных систем и обучения ранжирующих моделей. Сейчас работает над чат-ботом Циан-помощником для поиска недвижимости и консультации пользователей по объявлениям.
Напоминаем, что для того чтобы восстановить билет организатору можно не писать.
Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.