Некоммерческая исследовательская организация из Северной Каролины RTI International создаёт “команду специального назначения” для разработки новых методов анализа “больших данных”. Вице-президент Центра статистических и научных данных RTI Крэйг Хилл (Craig Hill) предлагает объединиться экспертам в области Big Data, чтобы сформировать свою команду мечты.

В интервью изданию Triangle Bussiness Journal Хилл поясняет, что в состав “спецназа” уже входят восемьдесят специалистов по вычислительной математике, статистике и прогнозной аналитике. В ближайшее время к ним присоединяться новые сотрудники:

“Сейчас основной процесс напоминает анализ разрывов: мы смотрим, что уже есть, и сравниваем это с тем, что хотят видеть наши клиенты”.

Затем начнётся привлечение новых специалистов. Полностью рабочая группа должна быть сформирована к сентябрю:

“Мы предлагаем комбинацию талантов этих людей с нашими знаниями и опытом в данной области. Вы нуждаетесь в том и другом, чтобы решить актуальные проблемы”.

В качестве примера успешной апробации метода указывается исследование рынка электронных сигарет, выполняемое RTI:

“Электронные сигареты – одна из вещей, которыми очень интересуется Центры по контролю и профилактике заболеваний США. Их использование не регулируется в настоящее время. Недавно мы предприняли попытку объединить данные отдельных исследований об электронных сигаретах с примерами их использования и злоупотребления. Мы перерыли Twitter, добавили все связанные твиты и нашли закономерности в использовании электронных сигарет”.

Социальные сети помогли не только определить круг потребителей электронных сигарет, но и составить личностный портрет одной из многочисленных групп:

“Например, мы выяснили, что большинство людей курят электронные сигареты демонстративно и хвастаются этим фактом. Продолжив сбор данных, мы определили, что большинство из них “курят” в школах”.

К такому выводу можно было прийти и по личным наблюдениям, однако статистика помогает перевести его на язык цифр, наблюдать явление в динамике и взять полученные сведения за основу прогнозирования. Хилл отмечает, что для подобных исследований сегодня уже требуются технологии “больших данных”:

“Мы уже сделали приблизительно шестьдесят научных проектов с использованием “больших данных” и уверены, что в будущем их число только возрастёт. Направление становится популярнее, и всё больше клиентов хочет использовать Big Data”.