Корпорация HP провела в Барселоне конференцию Discover 2013. На одной из сессий, где выступали вице-президент HP Autonomy Брайан Уайсс и вице-президент HP Vertica Шилпа Лаванда, речь зашла о “больших данных”.

11340424245_b73dbe0cf7_b

Решения Autonomy предназначены для поиска информации и управления знаниями, причём их главная особенность заключается в способности обрабатывать неструктурированные данные. Однако нужно понимать, что и сама информация, и технологические решения для её обработки – это не самоцель. Именно эту мысль пытался донести Брайан Уайсс, слова которого цитирует издание SiliconAngle: “Задача состоит в том, чтобы суметь извлечь из информации суть, осознание того, что в действительности происходит. Чтобы достичь этого, необходимо обладать способностью понимать её в человеческом выражении, работая при этом с гигантскими массивами данных. Если вам известно, что между десятью и одиннадцатью часами вы приняли десять миллионов телефонных звонков, если вы собрали кучу данных о каждом звонке, всё это прекрасно, но вот вопрос: что говорили звонящие? Были ли они вне себя? Вы не узнаете об этом без понимания, без анализа самих звонков”.

Платформа HAVEn, которую HP анонсировала в июне, предназначена для извлечения смысла из “больших данных”, причём речь идёт как о структурированной, так и о неструктурированной информации. Решение объединяет Hadoop с разработками Autonomy, Vertica и ArcSight. Интересная особенность HAVEn: платформа позволяет определить, какая информация не имеет отношения к делу, и избавиться от неё ради экономии ресурсов.

По словам Шилпы Лаванды, HAVEn может найти самые различные применения. В качестве одного из примеров она привела обработку информации, которую собирают датчики, – перспективное направление, взрывной рост которого ожидается в скором времени.

“Мы обнаруживаем вот что, – рассказывает Лаванда. – В изрядной доле информации, которую люди считают неструктурированной, – данные, полученные с сенсоров, машинные данные и тому подобные вещи, – в действительности прослеживается заметная структура, то есть эти данные частично структурированы. Сделав возможным для людей с лёгкостью “заглатывать” и анализировать такие данные, мы совершим огромный скачок”.