Как музыкальный сервис Pandora узнаёт и предсказывает предпочтения слушателей

Сегодня компания Pandora занимает достойное положение на рынке потокового радио. И дело не столько в её весьма многочисленной аудитории слушателей, сколько в том, что она сумела эффективно воспользоваться данными об этой аудитории, изучить её и выполнить своё обещание – «дать людям музыку, которую они действительно любят». Главное преимущество Pandora, отличающее её от множества других музыкальных сервисов, заключается в том, что слушатели могут создавать собственные «станции», где звучат только те песни, которые им нравятся. Система автоматически подберёт именно то, что нужно.

История Pandora началась с коммерческого провала. В далеком 2000 году Тим Вестергрен вместе с небольшой группой предпринимателей запустил смелый музыкальный проект под названием Music Genome Project. Его первичная идея была простой и красивой — разложить каждую песню на набор дискретных музыкальных характеристик для того, чтобы суметь впоследствии автоматически подбирать другие, похожие на неё.

Тим Вестергрен (фото: Intel Free press)

Первое, что необходимо было сделать для осуществления такой задачи, – это «взломать геном» музыкальной композиции, выявить в ней отдельные элементы. Такими элементами стали, к примеру, тональность, темп, подбор инструментов и др. Имея в распоряжении достаточный набор параметров, исследователи начали работу над алгоритмом, который позволил бы искать песни с идентичными атрибутами.

Однако несмотря на то, что у команды Genome действительно появилась какая-никакая возможность «алгеброй гармонию поверить», они решили, что процесс требует и человеческого вмешательства. С этой целью были наняты профессиональные музыканты. По сей день их работа заключается в прослушивании каждой песни и описании её с помощью 450 заранее определённых атрибутов. Каждый их них будет иметь оценку по заданной шкале, а итоговый результат становится отправной точкой для алгоритма, который ищет соответствие.

Когда Тим Вестергрен попытался лицензировать эту схему рекомендаций музыки другим компаниям, он встретил довольно прохладные отклики. Ему пришлось самостоятельно искать применение разработанной технологии.

В 2005 году он стал соучредителем компании Pandora — потокового онлайн-радио, использующего наработки Music Genome Project для автоматического создания пользовательских плейлистов. На сегодня аудитория Pandora составляет 72 миллиона активных слушателей. И все они ежедневно вносят свой вклад в копилку «больших данных», незаметно для себя обучая систему лучше понимать музыкальные вкусы людей.

Pandora тщательно собирает всю возможную информацию о пользовательских привычках. Её алгоритм принимает во внимание каждое действие пользователя — будь то перелистывание плейлиста вверх или вниз, пропуск какой-либо песни и т. д. Кроме того, пользователь может проголосовать за или против звучащей песни: в базе данных Pandora хранится более 22 миллиардов голосов. Каждый голос и каждое движение имеют определенный вес в этом алгоритме и влияют на то, какая песня окажется в списке следующей.

Не всегда можно сказать с уверенностью, почему именно этот слушатель решил пропустить именно эту композицию. Возможно, она ему действительно не нравится, но есть и другие варианты. Может быть, он просто искал что-то конкретное или был в неподходящем настроении. Pandora пытается понять мотивацию при помощи поведенческого анализа. Пользователь, ищущий определённую песню, будет игнорировать все остальные. Но вот неожиданно пропущенный трек — сигнал о том, что песня действительно не по душе. Реакция системы в каждом случае должна быть особой.

Офис Pandora в Чикаго (фото: Office Snapshots).

Используя подобный анализ, Pandora довольно успешно прогнозирует предпочтения даже новых пользователей системы. По старым же имеется богатая история их действий, и картина становится ещё более чёткой.

Надо сказать, что поведенческим анализом дело не ограничивается: принимаются во внимание и внешние факторы — например, время суток или устройство, с которого зашел пользователь. И это вполне логично. Мы же не слушаем с утра в тренажёрном зале то же самое, что и вечером перед сном. У нас нередко разные предпочтения для музыки в автомобиле и музыки в плеере. Вот интересно, не догадались ли ещё в Pandora принимать во внимание погоду?

Позволит ли этот впечатляющий набор пользовательских данных оказаться впереди таких конкурентов, как, скажем, Apple, которые наверняка также собирают немало полезной информации о предпочтениях своих слушателей? Владельцы Pandora дают на этот счёт оптимистичные прогнозы (а как же иначе). Общая логика их рассуждений в том, что Apple опирается на историю покупок, в то время как Pandora — на информацию о прослушиваниях. Да, при продаже музыки, вероятно, подход Apple будет эффективен — но не тогда, когда музыку предлагают просто прослушать. Ведь те композиции, которые пользователь решился купить, — это, возможно, лишь небольшая часть того, что ему действительно нравится. Поэтому для составления хорошего плейлиста информации о платежах, увы, недостаточно. И именно поэтому владельцы Pandora справедливо надеются, что их впечатляющие наработки и база данных будут музыкой для ушей потенциальных инвесторов.

Что будем искать? Например,ChatGPT

Мы в социальных сетях