По “Твиттеру” можно отслеживать, что в данный момент делает конкретная группа людей – что происходит в городе, стране, районе… Разумеется, такая информация не может не интересовать учёных, занимающихся статистикой. С помощью этих данных можно предугадать реакцию общественности на выход фильма, музыкального альбома или события. Увы, в таких исследованиях всегда есть проблема: проанализировать то, что пишут все пользователи, просто невозможно. Впрочем, как оказалось, не обязательно отслеживать активность абсолютно всех.

Мануэль Гарсия-Херранс из Автономного университета Мадрида в Испании и его коллеги выяснили, что для мониторинга настроений достаточно использовать группу “сенсоров” – активных пользователей, которые с наибольшей вероятностью быстрее воспринимают или распространяют ту или иную идею.

Для проверки этой идеи они выбрали две разных группы пользователей “Твиттера” и стали следить, в какой момент обе группы начинают использовать новые хэш-тэги относительно каких-либо тем.

Тут надо сделать отступление и сказать, каким образом группы выбирали. Первая, контрольная, была сформирована из обычных пользователей, выбранных случайным образом. После этого они отобрали по одному из фолловеров каждого пользователя и сформировали из них группу “сенсоров”.

Можно представить себе, что группы были примерно одинаковыми, но это не так. Фолловеры с большей долей вероятности являлись высокоактивными пользователями, которые также следят за незнакомыми им людьми. Учёные объясняют это так: “У ваших друзей чаще всего больше друзей, чем у вас”.

Чтобы проверить свою гипотезу о “сенсорах”, исследователи собрали данные об этих пользователях начиная с 2009 года. Была проанализирована информация о 40 миллионах пользователей, которые в сумме сгенерировали 1,5 миллиарда запросов на добавление других пользователей в друзья. Они сделали около миллиарда твитов, среди которых 67 миллионов содержали хэш-тэги.

Именно то, насколько быстро та или иная группа начинала пользоваться свежими хэш-тэгами, интересовало учёных. В среднем контрольная группа отставала на 7 дней.

О чём это говорит? О многом. С помощью выделения группы “сенсоров” можно с высокой степенью вероятности предсказывать политическую обстановку в стране, результаты выборов, а также отслеживать эпидемии. Твиттерные “сенсоры” позволяют узнать исход практически любого крупного события.