Американская компания Dataguise, разрабатывающая систему безопасности для популярного средства параллелизации обработки данных Hadoop, получила новую порцию инвестиций. Венчурный фонд Topa Capital и ещё несколько фирм вложили в Dataguise 13 миллионов долларов.

Hadoop представляет собой альтернативную реализацию технологии параллельной обработки данных MapReduce, созданной в Google. Она позволяет разделить обработку на множество процессов, каждый из которых выполняется на отдельном сервере, независимо от других. В результате становится возможным очень быстро обрабатывать огромные наборы данных, распределяя задачу между сотнями и даже тысячами машин (подробнее о принципах устройства MapReduce рассказано в статье Евгения Лебеденко «Технология Google MapReduce: разделяй и властвуй«)

Разработка Hadoop началась около десяти лет назад при непосредственном участии корпорации Yahoo!, использовавшей эту технологию в своём поисковике. Сейчас проект поддерживается сообществом открытых исходников. Hadoop — это одно из самых распространённых средств обработки «больших данных», применяемое множеством компаний и поддерживаемое такими гигантами, как IBM, Oracle и EMC.

Dataguise разрабатывает продукт под названием DG for Hadoop, помогающий компаниям увеличить защищённость данных, которые обрабатываются с помощью Hadoop. Продукт отыскивает в распределённых хранилищах Hadoop конфиденциальную информацию, оценивает вероятность утечки и подбирает подходящее решение проблемы.

DG for Hadoop автоматически выявляет в хранилищах с файловыми системами NFS и HDFS сведения, подлежащие защите, автоматически меняет права доступа к файлам, избирательно шифрует или маскирует «опасную» информацию — например, исключает из поступающих данных номера кредитных карт и социального страхования и лишь затем отправляет их для обработки на Hadoop (вся замаскированная информация сохраняется и впоследствии может быть восстановлена).

dghadoopss2

Dataguise сотрудничает с клиентами, работающими в сфере здравоохранения и биотехнологий, в фармацевтической и финансовой отраслях, а также в американских государственных органах. Это потребовало от компании полной поддержки стандартов, предъявляемых в США к организациям, связанным со здравоохранением и финансами.

В Dataguise планируют использовать полученные инвестиции для расширения продаж и маркетинга, причём не только в Соединённых Штатах, но и за их пределами. Кроме того, компания планирует усилить сотрудничество с лидерами по использованию Hadoop и расширить число продуктов, которые входят в линейку DgSecure.