Ученые AIRI разработали метод определения оптимального порога «холодного старта»

Анализ работ, опубликованных за 3 года на конференции RecSys, показал — только 10% объясняют смысл фильтрации датасета, ни одна не объясняет выбранный порог.

Ученые AIRI разработали метод определения оптимального порога «холодного старта»

Ученые из Института AIRI обнаружили отсутствие единой методологии для определения порогов «холодного старта». Понимать, сколько взаимодействий должно быть у объекта, чтобы считать его «холодным» или «теплым» особенно важно для научных исследований и работы онлайн-сервисов.

Эффект «холодного старта» — это ситуация, когда в системе рекомендаций появляется новый пользователь или товар с недостаточным количеством взаимодействий для надежного прогнозирования. Обычно такие объекты исключают заранее по порогу 5 взаимодействий на пользователя и товар (5-core фильтрация). Однако лишь 10% авторов статей на конференции RecSys за последние три года обосновывают необходимость фильтрации, не объясняя выбор порога.

Ошибочный порог может дорого стоить. Низкий порог приводит к большому количеству «шума», ухудшая качество рекомендаций. Высокий порог отсеивает важные данные, и алгоритмы теряют значимые взаимосвязи, что снижает точность метрик.

Ученые сделали первые шаги к автоматическому определению порога «холодного старта». Для пользователей порог определяли по резкому улучшению качества рекомендаций после определенной длины истории запросов. Для товаров анализировали подвыборки данных с разной частотой взаимодействий, чтобы выявить минимальное число взаимодействий для скачка метрик, указывающего на накопление достаточной информации.

Специалисты проверили популярные рекомендательные алгоритмы (SASRec, PureSVD, ItemKNN, EASER) на четырех датасетах: рейтинги фильмов (movielens-1m), отзывы о косметике (Amazon Beauty), искусство (Behance) и оценки пива (BeerAdvocate). Это позволило оценить подход независимо от архитектуры системы. Выяснилось, что оптимальный порог «размораживания» варьируется в зависимости от задачи и модели. Например, последовательные модели SASRec требуют в три раза больше взаимодействий для одного и того же датасета, чем классические алгоритмы.

«Мы показали, что произвольный и нефиксированный выбор порога «холодного старта» может радикально изменить выводы исследования — прозрачная методология необходима для корректного обучения и сравнения рекомендательных алгоритмов».

Никита Сухоруков, научный сотрудник группы «Технологии персонализации» Института AIRI

Таким образом, при проектировании и тестировании рекомендательных систем важно четко обосновывать выбор порогов фильтрации, и проводить обучение и тест на данных, отфильтрованных с использованием одного и того же параметра для сравниваемых моделей. Это единственная гарантия честной оценки качества работы алгоритма и воспроизводимости результатов.

Что будем искать? Например,ChatGPT

Мы в социальных сетях