Компания DataSift, разрабатывающая облачную платформу для мониторинга и анализа информации в социальных сетях, объявила о релизе системы VEDO, предназначенной для фильтрации постов в Twitter, Facebook, Tumblr и других источниках по заданным критериям.

DataSift является одним из лидеров в области социальной аналитики. Объём инвестиций в DataSift составляет $72 млн, причём более половины этой суммы было получено совсем недавно — в начале декабря. Венчурный фонд Insight Venture Partners, а также компании Scale Venture Partners, Upfront Ventures, IA Ventures, Northgate Capital и Daher Capital вложили в стартап $42 млн.

DataSift в реальном времени индексирует публичные посты, появляющиеся в различных социальных сетях. Архив таких постов представляет интерес, например, для маркетологов, изучающих реакцию публики на телевизионную рекламу, или социологов, следящих за изменением общественного мнения. Несколько примеров применения подобной информации рассмотрено в статье «Скрытое богатство Twitter«:

«Ценность данных, получаемых таким образом, давно не нуждается в доказательствах. С их помощью не без успеха прогнозируют колебания биржевых показателей, следят за распространением эпидемий и стихийными бедствиями, оценивают перспективы политиков и эффективность телевизионной рекламы. Они позволяют с неплохой точностью определить, что происходит сейчас и что будет дальше».

Особенность VEDO заключается в том, что эта система делает анализ социальных данных более доступным для неспециалистов. По словам Тима Баркера, директора DataSift по продуктам, большинство компаний по-прежнему испытывают трудности с извлечением пользы из «больших данных». VEDO решает эту проблему, позволяя пользователям с лёгкостью задавать собственные правила, категоризировать и кастомизировать данные.

screen-shot-2013-12-11-at-19-18-35

С помощью VEDO пользователи и разработчики приложений могут самостоятельно определять правила, согласно которым будут фильтроваться посты, настраивать средства категоризации и устанавливать веса и оценки, используемые при автоматическом извлечении смысла и контекста из крупных наборов неструктурированных данных. Встроенные в систему алгоритмы машинного обучения упрощают категоризацию. Кроме того, VEDO снабжена богатой библиотекой готовых классификаторов, которые можно использовать без доработки.