Acronis совершенствует дедупликацию в новых версиях программ

Компания Acronis выпустила новые версии программ для резервного копирования – Acronis Backup и Acronis Backup Advanced v.11.7. В них применяется оригинальный механизм дедупликации, который дает возможность обрабатывать в 24 раза больше данных при том же объеме выделяемой памяти. Это снижает общие затраты на хранение данных и на 40% ускоряет их аварийное восстановление.

Избыточность данных – краеугольный камень систем резервного копирования. Помимо заложенной на уровне алгоритмов необходимой избыточности существует и другая – паразитная. Она связана с тем, что большая часть регулярно сохраняемых в резервных копиях данных остаётся неизменной. Часто меняется только «продуктив» – новые записи в базах, свежие письма, документы и прочие файлы, находящиеся в непосредственной работе. Всё остальное становится объёмным информационным багажом, который снижает скорость резервного копирования и увеличивает требуемые объёмы.

Основатель Acronis Сергей Белоусов (фото: Dylan Love / The Daily Dot).
Основатель Acronis Сергей Белоусов (фото: Dylan Love / The Daily Dot).

Регулярное создание полной резервной копии – максимально надёжный, но и самый ресурсоёмкий вариант. В какой-то момент он становится слишком долгим процессом, который нагружает локальную сеть, требует расширения хранилища, оказывается слишком долгим сам по себе и не обеспечивает приемлемого времени восстановления данных в случае сбоя.

Схемы дифференциального и инкрементного бэкапа сокращают лишь объём новых резервных копий, записывая их как разницу соответственно с полной или последней копией. Однако чтобы определить и записать эту разницу, в обычных системах резервного копирования приходится каждый раз считывать и передавать для анализа все данные.

Управление агентами резервного копирования (изображение: Acronis).
Управление агентами резервного копирования (изображение: Acronis).

Решить эту проблему помогают алгоритмы дедпуликации – уменьшения объема трафика и хранимых данных путем выявления повторяющихся фрагментов и их однократной обработки. Дедупликация выполняется над блоками данных. Она предотвращает повторную передачу и сохранение идентичных блоков, снижая нагрузку на сеть и освобождая объём хранилища за счёт создания более компактных резервных копий.

Большинство современных систем резервного копирования используют тот или иной вид дедупликации, но размер обрабатываемых блоков у них фиксированный. Это снижает эффективность устранения повторяющихся фрагментов, так как в зависимости от структуры «продуктива» их фактический размер может быть разным.

В новых решениях Acronis Backup (Advanced) размер блока автоматически меняется в диапазоне от 1 байта до 256 КБ. Алгоритм выбора блока оптимального размера работает для резервных копий как на уровне дисков, так и на уровне файлов. Сам процесс дедупликации выполняется в два этапа: в источнике данных (агентом резервного копирования) и в хранилище бэкапов (как фоновый процесс, который автоматически запускается после завершения очередного бэкапа). Теперь для дедупликации терабайтаа уникальных данных требуется всего 128 МБ оперативной памяти вместо 3 ГБ.

Калькулятор окупаемости дедупликации для версии 11.5
Калькулятор окупаемости дедупликации для версии 11.5

Дедупликация наиболее эффективна при использовании режима полного резервного копирования. Заметный выигрыш в снижении используемого объёма хранилища и трафика она даёт и в схемах инкрементного бэкапа, если меняются не столько сами файлы, сколько место их расположения. Такая ситуация типична для большинства компаний, в которых используются стандартизированные на уровне софта рабочие места или сотрудникам часто рассылаются копии документов по текущим и выполненным проектам.

Для оперативного устранения избыточности на узле хранения Acronis Backup содержится база данных дедупликации. Она включает в себя значения хэшей для всех блоков данных в хранилище и занимает около 0,05 % от их суммарного объема (добавляет ≅ 0,5 ГБ на каждый терабайт уникальных данных). Её расположение можно и нужно задать вручную. Рекомендуется выбрать для неё диск с прямым подключением вместе сетевого, чтобы уменьшить задержки при обращении. Идеальный вариант – SSD RAID, но он вовсе не обязателен.

Эффективность дедупликации напрямую зависит от структуры файлов. Часть файлов нецелесообразно подвергать процедуре дедупликации (например, зашифрованные), поэтому значения хэшей для соответствующих им блоков данных в этой базе отсутствуют. Помимо зашифрованных файлов дедупликацию не рекомендуется применять для регулярного бэкапа баз данных. Изменения в БД обычно уникальны, и поэтому изначально обладают низкой степенью избычтосности. Поэтому для данных с низкой энтропией лучше использовать хранилище резервных копий без дедупликации.

Восстановление отдельных файлов (изображение: Acronis).
Восстановление отдельных файлов (изображение: Acronis).

Новые решения Acronis разрабатывались с учётом современных требований клиентов. Если раньше большинство заказчиков удовлетворял сам факт регулярного создания бэкапа, то сейчас их всё больше заботит уровень доступности данных в резервных копиях. Компании предъявляют возрастающие требования к скорости создания бэкапов и стремятся уменьшить время аварийного восстановления. Каждая минута простоя обходится не только внушительной суммой убытков, но и репутационными потерями.

Помимо новых алгоритмов дедупликации в Acronis Backup (Advanced) v.11.7 доступна расширенная поддержка хранилищ (включая сетевые СХД на основе NFS (SMB/CIFS, FTP и SFTP) и операционных систем (Microsoft Windows от 2000 SP4 до10, а также Windows Server 2003-2016 TP4, Red Hat Enterprise Linux 4.x–7.x, Oracle Linux 5.x–7.x (включая UEK), Fedora 11–22, Debian 4–8.2, Ubuntu 9.10–15.04, CentOS 5.x–7.x и других ОС Linux с версией ядра от 2.4.20 до 3.18 и 4.0/4.1, glibc 2.3.2 или более поздней версии).

Решения Acronis Backup (Advanced) основаны на фирменной платформе AnyData, разработанной для защиты данных в физических, виртуальных, гибридных и облачных средах. Они ориентированы в первую очередь на внедрение в компаниях малого и среднего бизнеса, поэтому для них предлагается вариант приобретения по подписке. Он позволяет сэкономить на долгосрочных капитальных вложениях и без значительных затрат опробовать разные модели развертывания – с размещением данных локально, у сервис-провайдеров, на серверах Acronis или по гибридной схеме.

Что будем искать? Например,ChatGPT

Мы в социальных сетях