Аналитический спецназ в мире «больших данных»

Некоммерческая исследовательская организация из Северной Каролины RTI International создаёт «команду специального назначения» для разработки новых методов анализа «больших данных». Вице-президент Центра статистических и научных данных RTI Крэйг Хилл (Craig Hill) предлагает объединиться экспертам в области Big Data, чтобы сформировать свою команду мечты.

В интервью изданию Triangle Bussiness Journal Хилл поясняет, что в состав «спецназа» уже входят восемьдесят специалистов по вычислительной математике, статистике и прогнозной аналитике. В ближайшее время к ним присоединяться новые сотрудники:

«Сейчас основной процесс напоминает анализ разрывов: мы смотрим, что уже есть, и сравниваем это с тем, что хотят видеть наши клиенты».

Затем начнётся привлечение новых специалистов. Полностью рабочая группа должна быть сформирована к сентябрю:

«Мы предлагаем комбинацию талантов этих людей с нашими знаниями и опытом в данной области. Вы нуждаетесь в том и другом, чтобы решить актуальные проблемы».

В качестве примера успешной апробации метода указывается исследование рынка электронных сигарет, выполняемое RTI:

«Электронные сигареты — одна из вещей, которыми очень интересуется Центры по контролю и профилактике заболеваний США. Их использование не регулируется в настоящее время. Недавно мы предприняли попытку объединить данные отдельных исследований об электронных сигаретах с примерами их использования и злоупотребления. Мы перерыли Twitter, добавили все связанные твиты и нашли закономерности в использовании электронных сигарет».

Социальные сети помогли не только определить круг потребителей электронных сигарет, но и составить личностный портрет одной из многочисленных групп:

«Например, мы выяснили, что большинство людей курят электронные сигареты демонстративно и хвастаются этим фактом. Продолжив сбор данных, мы определили, что большинство из них “курят” в школах».

К такому выводу можно было прийти и по личным наблюдениям, однако статистика помогает перевести его на язык цифр, наблюдать явление в динамике и взять полученные сведения за основу прогнозирования. Хилл отмечает, что для подобных исследований сегодня уже требуются технологии «больших данных»:

«Мы уже сделали приблизительно шестьдесят научных проектов с использованием “больших данных” и уверены, что в будущем их число только возрастёт. Направление становится популярнее, и всё больше клиентов хочет использовать Big Data».

Что будем искать? Например,ChatGPT

Мы в социальных сетях