Корпорация HP провела в Барселоне конференцию Discover 2013. На одной из сессий, где выступали вице-президент HP Autonomy Брайан Уайсс и вице-президент HP Vertica Шилпа Лаванда, речь зашла о «больших данных».
Решения Autonomy предназначены для поиска информации и управления знаниями, причём их главная особенность заключается в способности обрабатывать неструктурированные данные. Однако нужно понимать, что и сама информация, и технологические решения для её обработки — это не самоцель. Именно эту мысль пытался донести Брайан Уайсс, слова которого цитирует издание SiliconAngle: «Задача состоит в том, чтобы суметь извлечь из информации суть, осознание того, что в действительности происходит. Чтобы достичь этого, необходимо обладать способностью понимать её в человеческом выражении, работая при этом с гигантскими массивами данных. Если вам известно, что между десятью и одиннадцатью часами вы приняли десять миллионов телефонных звонков, если вы собрали кучу данных о каждом звонке, всё это прекрасно, но вот вопрос: что говорили звонящие? Были ли они вне себя? Вы не узнаете об этом без понимания, без анализа самих звонков».
Платформа HAVEn, которую HP анонсировала в июне, предназначена для извлечения смысла из «больших данных», причём речь идёт как о структурированной, так и о неструктурированной информации. Решение объединяет Hadoop с разработками Autonomy, Vertica и ArcSight. Интересная особенность HAVEn: платформа позволяет определить, какая информация не имеет отношения к делу, и избавиться от неё ради экономии ресурсов.
По словам Шилпы Лаванды, HAVEn может найти самые различные применения. В качестве одного из примеров она привела обработку информации, которую собирают датчики, — перспективное направление, взрывной рост которого ожидается в скором времени.
«Мы обнаруживаем вот что, — рассказывает Лаванда. — В изрядной доле информации, которую люди считают неструктурированной, — данные, полученные с сенсоров, машинные данные и тому подобные вещи, — в действительности прослеживается заметная структура, то есть эти данные частично структурированы. Сделав возможным для людей с лёгкостью “заглатывать” и анализировать такие данные, мы совершим огромный скачок».