Как Google Now угадывает ваши желания

В 2007 году тогдашний исполнительный директор Google Эрик Шмидт рассказывал о чудесном будущем, в котором поисковые машины научатся понимать желания людей и будут отыскивать ценную информацию без всякого запроса. Тогда словам Шмидта можно было только подивиться, но спустя всего шесть лет эти смелые речи перестали казаться фантастикой и превратились в реальность.

Между 2007 годом и нынешним днём есть большая разница, и в нашем случае она сводится к существованию смартфонов в их современном виде. Устройства, которые лежат в кармане и благодаря датчикам имеют непрерывную связь с реальным миром, — именно то, чего так недоставало поисковикам пять лет назад.

Сведения, собранные с помощью смартфона, позволяют машине составить более полное представление о пользователе. В этом смысле положение Google уникально: компания не только располагает огромными архивами проиндексированных данных со всего интернета и доступом к пользовательским аккаунтам с почтой, календарями, документами и заметками, но ещё и стоит за популярной мобильной платформой Android.

В Google прекрасно понимают, какие козыри оказались у них на руках, и уже пытаются пустить их в ход. Речь идёт о сервисе Google Now, который доступен обладателям смартфонов, работающих под управлением последних версий Android, и пользователям приложения Google Search для iOS.

Внешне Now выглядит очень просто: на экране телефона отображается набор карточек с информацией. К примеру, на одной может находиться напоминание о скором дне рождения знакомого, на другой — афиша интересного события, которое пройдёт по соседству, на третьей — прогноз погоды, недавняя новость или счёт спортивного матча, идущего прямо сейчас.

Карточки подбираются не случайным образом. Машина анализирует огромное количество данных, собранных о пользователе, и пытается понять, какая из них будет полезнее всего в данный момент. Эти данные, по сути, и становятся содержимым запроса, который поисковик задаёт сам себе при каждом обращении.

Иногда логика работы сервиса прямолинейна. К примеру, идея показать текущий счёт спортивной игры приходит в большую электронную голову Google после того, как вы раз или два поищете название этой команды в интернете. Если в ящик электронной почты упадёт извещение о посылке или электронный авиабилет, Google Now постарается напомнить о них в правильный момент. В случае с авиабилетом сервис даже способен извлечь из документа штрих-код и приготовить его к сканированию в аэропорту.

Но самое интересное — это те факты о пользователе, которые сервис Google получает не в готовом виде, а самостоятельно устанавливает на основе других сведений. Например, проанализировав историю перемещений смартфона по городу, машина сделает вывод о том, где пользователь живёт, а где — работает. После этого обладателю смартфона будет достаточно взглянуть на экран, чтобы увидеть, сколько времени займёт путь до работы с учётом актуальной информации о пробках (либо расписания общественного транспорта, если человек передвигается без машины).

http://www.youtube.com/watch?v=pPqliPzHYyc

Пока Google Now работает не в полную силу. Теоретически предоставлять данные для Now мог бы каждый сервис компании, но на практике этого не происходит. Вопрос не в том, как превратить их содержимое в красивые карточки. Чтобы добавить поддержку нового сервиса, разработчикам Google Now нужно понять, как именно вписать его в работу рекомендательной системы. Как и ответы на запрос к поисковику, карточки необходимо ранжировать в зависимости от их полезности. В данном случае это означает, что они должны подходить к текущей ситуации, а добиться этого — как раз самое сложное.

Knowledge Graph

Параллельно в Google работают над другим важным проектом — Knowledge Graph. Вы наверняка замечали на страницах поисковика карточки с разного рода справками. Картотека Knowledge Graph насчитывает более 500 миллионов справок о разнообразных объектах, людях, событиях и явлениях. Данные представлены в структурированном виде и пригодны для использования в хитроумных алгоритмах. В Google надеются, что Knowledge Graph позволит поисковику лучше понимать запросы пользователей и потихоньку начинать ориентироваться не только в интернете, но и в реальном мире.

Идеи, на которых основан Google Now, были предвосхищены исследованиями, проводившимися в Массачусетском технологическом институте (MIT) около десяти лет назад. Прикладную дисциплину о поиске закономерностей в данных, собранных с помощью мобильных телефонов, в MIT назвали reality mining (если термин data mining переводят как «добыча данных», то reality mining приблизительно соответствует «добыче данных из окружающей реальности»).

Исследователи пытались создать методологию для поиска закономерностей в повседневной жизни людей и их общении друг с другом. В одной из публикаций, датирующихся 2005 годом, они описывают эксперимент, где входными данными были перемещения людей: они определялись по данным о близлежащих сотовых вышках и маячках Bluetooth. Алгоритм, составленный на основе скрытой марковской модели, определял места как «дом», «работу» или «другое» с вероятностью 95% и мог строить правдоподобные предположения о том, где пользователь будет, к примеру, вечером, на следующий день или в выходные.

Выяснилось, правда, что такой подход годится не во всех случаях. Всё зависит от того, насколько упорядоченную жизнь ведут подопытные. Одни люди изо дня в день занимаются одним и тем же. Угадать их планы не составляет труда. Другие каждый день делают настолько разные вещи, что алгоритмам приходится туго. Эта проблема сохраняется и сегодня: точность прогнозов Google Now напрямую зависит от предсказуемости поведения его пользователей.

Пример с предугадыванием местонахождения был выбран исследователями из MIT за свою простоту, но потенциал у созданного ими метода куда больше. Во-первых, значительный объём данных позволяет прогнозировать более редкие события — например, регулярные поездки в какую-нибудь организацию раз в квартал или летний отдых за городом, случающийся каждое лето. Во-вторых, метод годится для вычисления социальных взаимодействий (о том, как это пригодилось в эпидемиологии, читайте в статье «Как «большие данные» вскрывают невидимые пути распространения эпидемий»).

Предсказания действий пользователя и обширная база знаний позволяют компьютерному помощнику давать более интересные советы и рекомендации. А уж какой открывается простор для коммерции! Уже сейчас Google Now умеет рекомендовать отели и рестораны, когда видит, что пользователь переместился в другой город. Чем дальше, тем больше разновидностей контекстной рекомендательной рекламы будет показывать сервис. Если Google AdSense показывает контекстную рекламу в интернете, то это её естественное продолжение в реальную жизнь.

В Google недолюбливают термин «большие данные» — боятся ассоциаций с оруэлловским «Большим Братом». Сама суть подхода, используемого компанией, подталкивает к рассуждениям на эту тему. Впрочем, справедливости ради надо заметить, что между Google и другими компаниями, накапливающими петабайты информации о людях, есть некоторая разница. Если супермаркеты или, к примеру, рекламщики без спроса собирают данные ради собственной выгоды, то Google предлагает пользователям добровольно поделиться информацией о себе в обмен на удобный сервис. Хотя в конечном итоге поисковик тоже не остаётся внакладе, это всё же подход с другой стороны — более близкой потребителю, а не к продавцу.

Какие достижения ждут Google Now дальше? О планах в компании не особенно распространяются, но можно не сомневаться, что возможности будут стремительно расширяться. Не исключено даже, что когда-нибудь сервис заработает в России как положено и будет учитывать местные особенности (пока с этим туго). А ещё поговаривают, что Google Now может занять место на Google.com, потеснив поисковую строку. Действительно, зачем что-то писать, если всё необходимое и так окажется под рукой?