Как музыкальный сервис Pandora узнаёт и предсказывает предпочтения слушателей

Big Data / Практика
автор: Ирина Парошина  11 ноября 2013

pandora_003Сегодня компания Pandora занимает достойное положение на рынке потокового радио. И дело не столько в её весьма многочисленной аудитории слушателей, сколько в том, что она сумела эффективно воспользоваться данными об этой аудитории, изучить её и выполнить своё обещание – «дать людям музыку, которую они действительно любят». Главное преимущество Pandora, отличающее её от множества других музыкальных сервисов, заключается в том, что слушатели могут создавать собственные «станции», где звучат только те песни, которые им нравятся. Система автоматически подберёт именно то, что нужно.

История Pandora началась с коммерческого провала. В далеком 2000 году Тим Вестергрен вместе с небольшой группой предпринимателей запустил смелый музыкальный проект под названием Music Genome Project. Его первичная идея была простой и красивой — разложить каждую песню на набор дискретных музыкальных характеристик для того, чтобы суметь впоследствии автоматически подбирать другие, похожие на неё.

Тим Вестергрен (фото: Intel Free press)

Тим Вестергрен (фото: Intel Free press)

Первое, что необходимо было сделать для осуществления такой задачи, – это «взломать геном» музыкальной композиции, выявить в ней отдельные элементы. Такими элементами стали, к примеру, тональность, темп, подбор инструментов и др. Имея в распоряжении достаточный набор параметров, исследователи начали работу над алгоритмом, который позволил бы искать песни с идентичными атрибутами.

Однако несмотря на то, что у команды Genome действительно появилась какая-никакая возможность «алгеброй гармонию поверить», они решили, что процесс требует и человеческого вмешательства. С этой целью были наняты профессиональные музыканты. По сей день их работа заключается в прослушивании каждой песни и описании её с помощью 450 заранее определённых атрибутов. Каждый их них будет иметь оценку по заданной шкале, а итоговый результат становится отправной точкой для алгоритма, который ищет соответствие.

Когда Тим Вестергрен попытался лицензировать эту схему рекомендаций музыки другим компаниям, он встретил довольно прохладные отклики. Ему пришлось самостоятельно искать применение разработанной технологии.

PandoraScreenshot

В 2005 году он стал соучредителем компании Pandora — потокового онлайн-радио, использующего наработки Music Genome Project для автоматического создания пользовательских плейлистов. На сегодня аудитория Pandora составляет 72 миллиона активных слушателей. И все они ежедневно вносят свой вклад в копилку «больших данных», незаметно для себя обучая систему лучше понимать музыкальные вкусы людей.

Pandora тщательно собирает всю возможную информацию о пользовательских привычках. Её алгоритм принимает во внимание каждое действие пользователя — будь то перелистывание плейлиста вверх или вниз, пропуск какой-либо песни и т. д. Кроме того, пользователь может проголосовать за или против звучащей песни: в базе данных Pandora хранится более 22 миллиардов голосов. Каждый голос и каждое движение имеют определенный вес в этом алгоритме и влияют на то, какая песня окажется в списке следующей.

Не всегда можно сказать с уверенностью, почему именно этот слушатель решил пропустить именно эту композицию. Возможно, она ему действительно не нравится, но есть и другие варианты. Может быть, он просто искал что-то конкретное или был в неподходящем настроении. Pandora пытается понять мотивацию при помощи поведенческого анализа. Пользователь, ищущий определённую песню, будет игнорировать все остальные. Но вот неожиданно пропущенный трек — сигнал о том, что песня действительно не по душе. Реакция системы в каждом случае должна быть особой.

Офис Pandora в Чикаго

Офис Pandora в Чикаго (фото: Office Snapshots).

Используя подобный анализ, Pandora довольно успешно прогнозирует предпочтения даже новых пользователей системы. По старым же имеется богатая история их действий, и картина становится ещё более чёткой.

Надо сказать, что поведенческим анализом дело не ограничивается: принимаются во внимание и внешние факторы — например, время суток или устройство, с которого зашел пользователь. И это вполне логично. Мы же не слушаем с утра в тренажёрном зале то же самое, что и вечером перед сном. У нас нередко разные предпочтения для музыки в автомобиле и музыки в плеере. Вот интересно, не догадались ли ещё в Pandora принимать во внимание погоду?

pandora_011Позволит ли этот впечатляющий набор пользовательских данных оказаться впереди таких конкурентов, как, скажем, Apple, которые наверняка также собирают немало полезной информации о предпочтениях своих слушателей? Владельцы Pandora дают на этот счёт оптимистичные прогнозы (а как же иначе). Общая логика их рассуждений в том, что Apple опирается на историю покупок, в то время как Pandora — на информацию о прослушиваниях. Да, при продаже музыки, вероятно, подход Apple будет эффективен — но не тогда, когда музыку предлагают просто прослушать. Ведь те композиции, которые пользователь решился купить, — это, возможно, лишь небольшая часть того, что ему действительно нравится. Поэтому для составления хорошего плейлиста информации о платежах, увы, недостаточно. И именно поэтому владельцы Pandora справедливо надеются, что их впечатляющие наработки и база данных будут музыкой для ушей потенциальных инвесторов.

Поделиться
Поделиться
Tweet
Google
 
Читайте также
Как хеджфондовый миллиардер организовал Brexit и победу Трампа
Как хеджфондовый миллиардер организовал Brexit и победу Трампа
Кремниевый детектив RAVN ловит коррупционеров. Пока – британских
Кремниевый детектив RAVN ловит коррупционеров. Пока – британских
Сбербанк открывает свои данные
Сбербанк открывает свои данные
  • Пётр

    Надеюсь, со своей популярностью они наконец найдут силы (или чего ещё не хватает), чтобы выйти за пределы Штатов и Океании. Потому что это, по крайней мере на уровне идеи, как раз то, чего я давно ищу от плеера/музыкального сервиса. И очень круто, если они действительно размечают характеристики песен с помощью музыкантов, потому что наука, насколько я понимаю из результатов конференции на эту тему (http://www.music-ir.org/mirex/results/2013/mirex_2013_poster.pdf ), ещё далека от удовлетворительного автоматического анализа.

    • Жабот

      Непродолжительными плясками с бубном Пандору можно заставить играть вне США, поищите ссылки на плагин Mediahint к Хрому и Мозилле. Это если про попробовать. А так-то да, пускай кончают эту муру с геолокацией.

  • Несколько месяцев назад у них что-то случилось, что все предлагаемые мне песни по времени проигрывались за полдня. Ушёл от них. Месяц назад вернулся — коллекция разнообразилась.

    Для интересующихся аналогичными сервисами могу предложить http://www.jango.com и https://www.aupeo.com/. Причём почему-то на всех трёх сервисах я слушаю разные песни, хотя предпочтения у меня одни и тежи.

Хостинг "ИТ-ГРАД"
© ООО "Компьютерра-Онлайн", 1997-2017
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.
«Партнер Рамблера» Почта защищена сервером "СПАМОРЕЗ" Хостинг "Fornex"