Технологии снижения затрат для систем хранения данных

Скачать White Paper [PDF]

 

Системы хранения данных, как и большинство компонентов ИТ-инфраструктуры, — это сложные и дорогостоящие программно-аппаратные комплексы. Их приобретение и содержание требует соответствующих капитальных и операционных расходов: от аппаратной модернизации до оптимизации процессов администрирования.

Реагируя на запросы рынка, производители создают различные технологии и подходы, которые позволяют снижать издержки в том или ином сегменте затрат. Кто-то сокращает операционные затраты за счет упрощенного обслуживания, кто-то предлагает легкие способы расширения и масштабирования, кто-то разрабатывает программные методы экономичного размещения данных.

Так или иначе, пользователи заинтересованы в том, чтобы увеличить разнообразие способов и технологий для наиболее подходящего решения своих задач.

Вызовы и проблемы

Данных становится все больше и больше

Это очевидное заявление, которое формирует текущую реальность. Увеличивается интенсивность информационного обмена, появляются новые формы и способы обработки информации, растет размерность файлов и изменяются требования к глубине архивов. Этой реальности требуется соответствующая инфраструктура.

Появляются новые типы задач и приложений

Многомерная аналитика в бизнесе, технологии искусственного интеллекта, умный анализ записей видеонаблюдения и многое другое — то, что совсем недавно было концептуальным и новым, сейчас активно внедряется в виде прикладных решений. Очевидно, что такие технологии подходят не всем компаниям, и далеко не все могут их себе позволить, но уже сейчас это активно формирует ту технологическую реальность, в которой существует современный бизнес. Эти технологии будут становиться драйверами конкуренции и влиять на отраслевые нормы.

Изменяются условия конкуренции

Вместе с появлением новых задач и приложений ускоряется темп всеобщей модернизации: компаниям приходится адаптироваться к новым типам нагрузок, которые требуют дополнительных расходов на ИТ-инфраструктуру.

Будет все сложнее оставаться конкурентоспособным без постоянной модернизации, в первую очередь в тех сферах, где технологические возможности сильно влияют на производимый продукт: безопасность, производство видеоконтента, медицина, образование, машиностроение, сфера финансов и т.д. При этом придется конкурировать с теми, кто может позволить себе регулярное обновление и покупку дорогостоящих программно-аппаратных решений.

Ускоряется моральный износ

Всего несколько лет назад вы тщательно выбирали серверное оборудование и софт, прогнозировали рост данных и планировали дальнейшее развитие инфраструктуры. Сегодня существенная часть из тех приобретений уже страдает от неотвратимого морального устаревания.

Купленные ранее решения уступают место более эффективным и переходят в разряд низколиквидного второстепенного оборудования. Такое оборудование остается на балансе предприятия, исправно функционирует, но уже не всегда справляется с новой нагрузкой.


Представленные тенденции показывают, что условия выбора СХД стремительно усложняются. В современных реалиях важно найти баланс между стоимостью решения и его возможностями справляться с новыми типами нагрузок.

Для этого мы предлагаем рассмотреть пять технологий, которые помогут вам сократить затраты на аппаратную часть СХД, оставляя возможности для приобретения дополнительного функционала.

1. Использование программно-определяемых СХД

Системы хранения данных можно разделить по принципу их построения на две основные группы: программно-определяемые СХД и классические СХД. И те, и другие представляют собой систему из программного обеспечения и аппаратных компонентов.

В программно-определяемых СХД (SDS, software-defined storage) весь основной функционал обеспечивается программной частью, а “железо” подбирается из перечня совместимых решений. В таком подходе важна роль компании-сборщика, который создает программно-аппаратное решение под конкретный запрос или наиболее популярные задачи рынка.

Классические СХД являются цельными комплексами, где “железо” разрабатывается в соответствии с возможностями ПО, и наоборот. Такая тесная связка hardware-software дает производителям преимущества при разработке сложной функциональности и улучшении эксплуатационных характеристик. В итоговом варианте вендор предоставляет рынку несколько готовых решений, собранных под наиболее популярные типы задач.

И среди программно-определяемых СХД, и среди классических есть решения разных ценовых категорий. Давайте рассмотрим два основных преимущества, которые снижают затраты на оборудование при использовании программно-определяемых СХД.

SDS позволяет не переплачивать за лишние опции

Когда вы покупаете классическую СХД, то платите за полностью готовое решение. Вам приходится оплачивать стоимость всех компонентов и всех работ по производству, тестированию и сервису.

При покупке программно-определяемой СХД вы можете выбрать именно тот набор опций, который требуется. Так как основной функционал такой системы предоставляется со стороны ПО, возможно максимально точно подобрать аппаратные компоненты, не оплачивая “стандартно” поставляемые карточки, интерфейсы и накопители. Платите только за то, что будет решать вашу конкретную задачу.

SDS сокращает потери при аппаратных обновлениях

Модернизация аппаратных компонентов неизбежна, более того — период между модернизацией каждого элемента вашей СХД стремительно сокращается. Ситуация вынуждает вас переходить на новые протоколы и накопители, приобретать более производительные контроллеры и более емкие дисковые корзины.

В случае с классическими СХД такая парадигма грозит колоссальными затратами: вам придется покупать полностью новую систему. Программно-определяемые СХД дают возможность выборочной замены компонентов без существенных вложений в модернизацию. Например, в большинстве случаев вы можете вставить в систему новые накопители с большим объемом без обновления программной части.

2. Параллельный SSD кэш для снижения износа накопителей

Твердотельные накопители используются в гибридных системах как буферное пространство SSD-кэша, куда помещаются «горячие» данные — блоки информации с высоким числом повторных обращений. При этом флеш-накопители имеют ограниченное число перезаписей, которым определяется их рабочий ресурс.

В преобладающем большинстве гибридных систем хранения используется кэш второго уровня. При таком подходе запросы сначала поступают в RAM, потом на SSD, а лишь затем в основное хранилище, на HDD. В таких условиях флеш-накопители получают интенсивную нагрузку, которая быстро сокращает срок их службы.

 Традиционный SSD-кэш второго уровня в СХД

Рисунок 1. Традиционный SSD-кэш второго уровня.

Альтернативным подходом является использование параллельного SSD-кэша. Для реализации такой схемы используется механизм распределения поступающих запросов (детектор), который направляет на SSD только тщательно отобранные данные.

Схема работы SSD-кэша в системе хранения данных RAIDIX

Рисунок 2. Схема работы SSD-кэша в RAIDIX

В RAIDIX параллельный SSD-кэш реализован с использованием уникальных алгоритмов замещения и принципа Log-структурированной записи. Это позволяет сократить количество обращений (write hits) к ячейкам флеш-накопителей до рекордных 1.8, в то время как у традиционного SSD-кэша на основе алгоритма LRU этот показатель составляет 10.8 write hits.

Таким образом, благодаря реализованной в RAIDIX технологии SSD-кэша твердотельные накопители могут служить до 6 раз дольше.

3. Сокращение избыточности накопителей с RAID 7.3

Администраторы СХД стремятся организовать пространство хранения таким образом, чтобы RAID-массивы обеспечивали необходимый уровень доступности, использовали под контрольные суммы наименьшее количество накопителей и были максимально производительными. Именно поэтому большинство систем хранения организовано при помощи RAID 6: неплохая производительность и всего два диска под контрольные суммы для высокого уровня надежности.

В качестве альтернативы данному массиву можно использовать RAID с тремя контрольными суммами. В RAIDIX применяется RAID 7.3, который практически не уступает RAID 6 по скорости, но выдерживает одновременный отказ трех дисков в массиве. Высокая надежность массива позволяет получить желаемый уровень доступности данных при меньшем количестве избыточных накопителей.

Сокращение избыточности накопителей с RAID 7.3

Рисунок 3. RAID 7.3 требует до 30% меньше накопителей, чем RAID 6*

*Данный расчет был сделан для массивов из HDD дисков по 12 ТБ, работающих в условиях постоянной записи с приоритетом реконструкции на уровне 15%. Уровень доступности массивов: 99,9999%.

4. Виртуализация сторонних СХД

Системы хранения данных устаревают довольно быстро. Параллельно с процессом устаревания в компании может меняться структура, сотрудники, поставщики и предпочтения — все это нередко способствует появлению разрозненного оборудования и программно-аппаратных мощностей, которые не соответствуют существующим задачам.

Чтобы избежать полной и дорогостоящей замены систем хранения данных можно использовать метод виртуализации сторонних СХД. Такая технология позволяет организовывать несколько СХД в единую виртуальную систему хранения.

Например, SAN Optimizer может подключать к RAIDIX внешние СХД и осуществлять с ними работу, как с локально подключенными дисками. Он способен создавать RAID-массивы и разделы LUN на уже существующих дисковых полках.

Выгода от использования этой технологии сильно зависит от каждого конкретного случая, но для наглядности можно рассмотреть вот такой сценарий модернизации:

Оборудование Без виртуализации СХД С виртуализацией СХД
Основная СХД На замену Как дисковая полка
Второстепенная СХД На замену Как дисковая полка
Основная СХД (новая) Купить Купить
Второстепенная СХД (новая) Купить Купить
Дисковая полка (новая) Купить Не требуется

5. Поддержка гетерогенных инфраструктур

Нередко встречается ситуация, когда с одним набором данных на СХД работают несколько клиентов, которым требуются разные уровни производительности. Например, пост-продакшн команда из 5 человек может работать над проектом, размещенном на одном томе: трое работают с цветокоррекцией, а двое — со звуком. Для первых требуется высокоскоростной доступ, а для двух других — обычный.

В большинстве СХД том с данным можно предоставить только по одному типу интерфейса. Соответственно, придется выбирать высокоскоростной доступ для всех пяти клиентов, например, по FC 32Gbit.

При поддержке гетерогенных инфраструктур специалистов по звуку можно подключить по более доступному интерфейсу, например, Ethernet 10Gbit. Снижение затрат на оборудование заключается в том, что на стороне клиента понадобится всего три дорогостоящих карточки Fibre Channel, а не пять.

Такая экономия может показаться незначительной, но надо помнить, что стоимость карточек FC 32Gbit может быть выше Ethernet 10Gbit в несколько раз. С увеличением инсталляции такая выгода становится более существенной.

Заключение

При проектировании инфраструктуры хранения данных вы постоянно сталкиваетесь с выбором тех или иных опций. При этом каждое принимаемое в этих ситуациях решение неотвратимо проходит проверку на экономичность: сможет ли это сократить бюджет закупки, позволит ли получить выгоду в перспективе и т.д.

Важно, чтобы у заказчика — партнера или конечного пользователя — всегда было разнообразие опций. Это имеет значение и на уровне стратегических решений, которые касаются всей серверной архитектуры, и на уровне менее масштабных задач, например, организации томов и подключений.

Мы разобрали пять технологий, которые помогают сокращать затраты на аппаратную часть СХД. Каждый из представленных подходов в той или иной степени используется нашими партнерами и заказчиками и предоставляет измеримую выгоду в реальных условиях.