Реализация программного RAID

В RAIDIX программный RAID реализован на уровне ядра операционной системы. Он разрабатывался специально для обеспечения высокой производительности и доступности данных.
RAID массив для высокой производительности и доступности данных
В системе RAIDIX используются следующие уровни RAID-массивов:

RAID 0, RAID 10 – стандартные, без контрольных сумм.
RAID 5, RAID 6 – стандартные, наиболее распространенные.
RAID 7.3, RAID N+M – собственной разработки.

Скорость расчета контрольных сумм (на 1 вычислительное ядро)

Благодаря уникальному методу расчета контрольных сумм, использующему оригинальное размещение обрабатываемых данных на векторных регистрах процессора, удается достигать высочайшей скорости восстановления данных.

Просадка производительности при отказах на последовательных запросах

Не более 10%

25 GBps

RAID массив на базе векторной библиотеки

Применение

В системах хранения данных RAID-массивы используются как для создания виртуального пространства на основе имеющихся физических носителей, так и для сохранности информации при выходе дисков из строя. При этом главным фактором производительности RAID-массива является скорость вычисления контрольных сумм и скорость восстановления данных из этих контрольных сумм.

Актуальным требованием для СХД является баланс между скоростью восстановления данных RAID-массива, количеством избыточных дисков и уровнем доступности данных при отказах.

В RAIDIX реализована уникальная модель программного массива, которая обладает рекордной скоростью восстановления данных в сочетании с высоким уровнем надежности и доступности.

Особенности расчетного модуля RAID

Расчет контрольных сумм в наших программных RAID-массивах основан на векторизации вычислений с использованием расширений SSE4.2 и AVX процессоров Intel.

При этом, ключевое преимущество RAIDIX состоит в оригинальном подходе к векторным вычислениям, который позволил увеличить скорость кодирования и декодирования данных более чем в два раза по сравнению с другими, уже «разогнанными» векторизацией, библиотеками (ISA-L и Jerasure).
Сравнение скорости кодирования и декодирования на примере RAID 6.



Сравнение скорости кодирования и декодирования на примере RAID 6.

Значения RAIDIX сравниваются с результатами библиотек ISA-L (Intel) и Jerasure.
Во многих системах хранения данных, использующих технологию RAID, расчёт контрольных сумм производится кодами Рида-Соломона с помощью арифметики конечных полей Галуа. Благодаря особому расположению данных в векторных регистрах, RAIDIX позволят выполнять операцию умножения в поле сразу над 512 элементами, исполнив несколько простых инструкций.

Стоит отметить, что этот метод расчетов прекрасно параллелизуется, и суммарная производительность алгоритма растет почти линейно в многоядерных и многосоккетных системах.

RAID 7.3

RAID 7.3 – уровень чередования блоков с тройным распределением четности, который позволяет восстанавливать данные при отказе до 3-х дисков. RAID 7.3 является аналогом RAID 6, но имеет более высокую степень надёжности, благодаря расчету сразу трех контрольных сумм. RAID 7.3 существенно снижает вероятность отказа дисков без потерь в производительности и стоимости, поэтому рекомендуется использовать этот уровень для массивов объемом более 32 ТБ.
RAID массив с тремя контрольными суммами



В RAID 7.3 для хранения контрольных сумм отводится емкость 3 дисков.

RAID N+M

RAID N+M – уровень чередования блоков с M распределением четности, основанный на проприетарном алгоритме RAIDIX. RAID N+M позволяет пользователю самостоятельно определить количество дисков, выделяемых под хранение контрольных сумм. Это обеспечивает высочайший уровень надежности — уникальная технология RAIDIX позволяет восстановить данные при отказе до 32 дисков (в зависимости от количества дисков, выделяемых под контрольные суммы).
RAID массив с настраиваемым количеством контрольных сумм



В RAID N+M M дисков выделяется под контрольные суммы. N обозначает количество дисков под хранимые данные.

Возможности технологии

Реализация программного массива в RAIDIX является ключевой технологией продукта. Глубокие математические исследования позволили создать действительно мощный инструмент, который сочетает в себе производительность, экономичность и высокий уровень сохранности данных.

Данная технология характеризуется рядом ключевых особенностей:

• Рекордная скорость расчета контрольных сумм, многократно превосходящая существующие аналоги.
• Возможность самостоятельного определения количества дисков для контрольных сумм (для RAID N+M).
• Повышение эффективности сопутствующих технологий — упреждающей реконструкции и частичной реконструкции.
• Высокий уровень отказоустойчивости при использовании массивов RAID 7.3 и RAID N+M.