Путешествия и большие объёмы информации – вещи, связанные совершенно естественным образом. Даже если речь идёт о поездке в один город, ориентироваться в авиакомпаниях, рейсах, отелях, ресторанах и достопримечательностях – тяжёлая работа. Что уж говорить о поездке по нескольким странам. С точки зрения обслуживающих компаний изучение привычек клиентов при помощи анализа данных – тоже чрезвычайно полезная и выгодная вещь. Иногда в улучшении нуждаются какие-то мелочи, но какие именно? Разобраться в этом бывает непросто.

picture По заказу компании Amadeus, специализирующейся на бронировании билетов и гостиниц, профессор Томас Дейвенпорт составил доклад, в котором рассмотрел разные случаи использования технологий “больших данных” в туриндустрии и попытался предсказать, какие новые применения окажутся востребованными.

На протяжении многих лет у компаний, предоставляющих услуги путешественникам, был доступ к самым разнообразным источникам информации. Брони билетов и номеров, аренда транспорта и многое другое оставляет “след”, из которого при желании можно многое узнать о маршрутах, привычках и предпочтениях. Сотни терабайт или даже петабайты информации до сих пор хранились неструктурированными и непроанализированными. Предстоит большая работа!

Ряд связанных с туризмом компаний – как начинающих, так и более чем солидных – уже получает выгоду от использования “больших данных”. Дейвенпорт провёл исследование более двадцати подобных случаев и представил в докладе истории успеха.

Сервис Kayak, позволяющий искать билеты на самолёт и бронировать гостиничные номера, обрабатывает более миллиарда поисковых запросов ежегодно, что дает массу данных для последующего анализа. Когда пользователь что-то ищет при помощи Kayak, за сортировку результатов отвечают хитрые алгоритмы. Это не столь очевидно, когда речь идёт о поиске авиабилетов (их достаточно отсортировать по цене), а вот в случае с гостиницами важно учитывать более продвинутые критерии: удаленность от заданной клиентом точки, предоставляемые услуги и развлечения, а также соотношение цены и качества в сравнении с другими вариантами.

Ещё Kayak использует аналитические модели для того, чтобы обеспечивать соответствие между ценами, которые отображаются на её сайте и на сайтах авиакомпаний. Сбои при синхронизации между источниками данных нередки, и предиктивный алгоритм помогает не допускать ошибок. Не так давно в Kayak представили новую систему прогнозирования стоимости авиабилетов, предсказывающую, упадёт или вырастет цена на определённый рейс за ближайшую неделю.

Kayak работает на кластере Hadoop, с переходом на который временные затраты на вычисления удалось свести к нескольким минутам. Используются также скриптовые языки, популярные у специалистов по “большим данным”, и набор статистических утилит с открытыми исходными кодами.

Конкурирующий сервис Hipmunk тоже вовсю использует “большие данные”. В этой компании разработали клиентскую систему, которая на основе фирменных алгоритмов позволяет ранжировать авиарейсы и гостиницы по разнообразным критериям. К примеру, для оценки авиакомпаний существует показатель под названием “мучительность”, который рассчитывается с учетом продолжительности перелета и количества пересадок. Для оценки гостиниц Hipmunk создала алгоритм для расчета “индекса восторга” – с учётом цены за номер, предоставляемых услуг и оценок клиентов. Возможности сравнения по критериям выделяют Hipmunk на фоне многих других сайтов для путешественников.

Bigdata для путешествий

Для внутреннего пользования Hipmunk также применяет “большие данные” – в первую очередь для того, чтобы проанализировать поведение посетителей на своем сайте. Записываются каждый клик и вся последовательность страниц, на которые переходил пользователь. По результатам А/Б-тестирования принимаются решения о том, как доработать интерфейс.

Традиционные бизнесы тоже не чужды анализу данных, причём некоторые практикуют это ещё с “доисторических” времён. Сетевой отель “Мариотт” одним из первых принял на вооружение анализ данных для управления потоками прибыли, и эта практика применяется уже около двадцати пяти лет. Гостиницы таким образом определяют оптимальную цену за номер и получают больше денег в том случае, когда удаётся дать такой прогноз, при котором все номера будут распроданы. Предиктивные алгоритмы помогают решить даже такие вопросы, как выбор объектов для ремонта: исследования показывают, что небольшие улучшения окупаются лучше всех.

Анализ данных помогает и авиакомпаниям – например, British Airways. “Они собирают и обобщают всю информацию о пассажирах, хотя эти данные всегда были распределены очень разрозненно”, – пишет Дейвенпорт. К той же базе данных имеют доступ и сотрудники British Airways, которые непосредственно работают с пассажирами. Экипажи вооружены планшетами и могут в любой момент узнать или обновить информацию о пассажире.

Многие авиакомпании продвигают управление доходами на новый уровень, подсчитывая, к примеру, издержки на группу пассажиров, пропустивших пересадку из-за задержки рейса, чтобы определить, будет ли выгоднее отложить стыковочный рейс или зарезервировать им места на следующем вылете.

По мнению Дейвенпорта, исследование больших и сложных наборов данных в ближайшее время сможет буквально преобразить индустрию путешествий. То, что раньше вызывало сложности, будет даваться путешественникам без всяких усилий.