Введение в RAID: RAID-6 и гибридный RAID






Как говорилось в предыдущей статье, при использовании RAID-5 могут возникнуть проблемы в случае использования больших дисков, а также большого их количества. В RAID-6 сделана попытка решить эту проблему за счёт использования двух блоков чётности в полоске данных, вместо одного.




На картинке ниже (взято с Википедии, автор — Cburnett) проиллюстрирован принцип записи данных на пятидисковый массив RAID-6.

На этой иллюстрации первые блоки чётности в полоске данных помечены индексом «p», а вторые — индексом «q». Использование двух блоков чётности приводит к тому, что уменьшается полезная ёмкость массива RAID-6, которая вычисляется следующим образом:

Это означает, что общая ёмкость массива RAID-6 ограничена ёмкостью наименьшего диска (вы можете использовать диски разной ёмкости), входящего в его состав, умноженной на количество дисков минус два. «Минус два» — это два диска, используемые в каждой полоске данных для хранения блоков чётности.

Вычисление первого блока чётности «p» выполняется так же, как и в RAID-5, а вот второй блок чётности высчитывается более сложным способом. Следствием этого является то, что производительность записи в массиве RAID-6 ниже, чем в RAID-5. Скорость чтение в RAID-6 не отличается, поскольку нет необходимости считывать блоки чётности.

Взамен на сниженную производительность записи в RAID-6 вы получите повышенную надёжность, при которой вы можете потерять одновременно два диска, при этом сохранив возможность восстановления данных, в то время как при использовании RAID-5 вы можете позволить себе потерять не более одного диска. Возвращаясь к потенциальным проблемам, присущим использованию большого количества дисков в RAID-5, следует отметить, что в RAID-6 актуальность данной проблемы снижается.

Подытожим основные моменты, присущие RAID-6:

  • плюсы:
    • очень высокая надёжность хранения данных (вы не потеряете данные, если два диска массива выйдут из строя);
    • высокая скорость чтения;
  • минусы:
    • снижение производительности записи из-за необходимости вычислять, пересчитывать и обновлять блоки чётности;
    • требуется больше вычислительной мощности контроллера для вычисления двух блоков чётности.
  • минимальное количество дисков в массиве: 4 (крайне желательно, чтобы они были одинаковыми).

Гибридный RAID

Как вы видите, у каждого стандартного уровня RAID (0-6) существуют какие-либо недостатки. Некоторым уровням присуща высокая производительность (RAID-0), в то время, как надёжность оставляет желать лучшего. У других надёжность хранения крайне высока (RAID-6), однако производительность записи заметно снижена. Как вы уже могли догадаться, люди в какой-то момент задались вопросом: а почему бы не скомбинировать различные уровни RAID, чтобы получить «всё и сразу»? Решение такого вопроса привело к появлению того, что называется гибридными уровнями RAID, или, как их ещё иногда называют, вложенными (nested) уровнями RAID.

Рассказ о гибридных RAID выходит за рамки этой заметки, поэтому мы поговорим о них в других статьях этой серии. Если же в двух словах, то гибридные RAID строятся путём объединения стандартных уровней RAID определённым образом.

Например, существует уровень RAID 1+0 или RAID-10. Первая цифра — это уровень RAID, используемый как «нижний» в гибридной конфигурации. Второй номер слева определяет уровень RAID, который используется в качестве «верхнего». Верхний уровень использует нижние как блоки.

В случае с RAID-10 получается следующее. Несколько пар дисков, объединённых в RAID-1, объединяются в массив RAID-0. В этом случае надёжность хранения RAID-1 объединяется с высокой производительностью чтения/записи RAID-0.

В заключение

Этой заметкой завершается введение, (краткий обзор, если хотите) концепции и стандартных уровней RAID. Для кого-то это может совсем новым материалом, кто-то, вероятно, уже имел дело с использованием RAID в своей работе. В следующих статьях мы с вами познакомимся с гибридным RAID.

Источник: Linux-Mag.Com




Введение в RAID: RAID-6 и гибридный RAID: 2 комментария

  1. принципы работы разных raid — конечно, важны... Но за рамками остается главный вопрос — какой raid лучше использовать (на практике)? Вот такая статья была бы полезнее, чем все эти описания принципов работы разных raid...

    ----пример статьи на эту тему----

    Есть 2 (только!) причины применения raid: 1) надежность (сохранность данных) 2) увеличение производительности (скорость чтения/записи с дискового массива)

    Для 2011 г. 2-я причина уже мало актуально. Выигрыш в производительности на 10-20...пусть даже 50% в наше время (2011г.) уже неактуально. Одно дело, когда речь идет о разнице 10 мин. или 15 мин., а другое 1 сек. или 1,5. сек. Во втором случае (в большинстве случаев, простите за тавтологию) — этой разницей можно безболезненно пренебречь...

    Тогда рассмотрим 1-й аспект: надежность.

    В 90% случаев raid используется для «показухи»: «мы используем raid!!!»... потом сервер убирается в стойку (или под стол). И?!

    Еще раз: стандртная ситуация: у меня есть ПО, которое я установил на «сервер» (с raid) и отдал клиенту... После этого за состоянием raid НИКТО не следит... Когда он «сломается» it-шники обоснуют, почему клиент дурак. И все дела. Если же вам действительно нужно, чтобы система жила и здравствовала — ЗА НЕЙ НАДО СЛЕДИТЬ.

    В случае аппаратного raid — смотреть на показания лампочек, с случае софтварного — проверять /proc/mdstat...

    И в 50% случаев НИКТО этим не занимается. В итоге наступает ситуация, когда система накрывается. «Ой, все сломалось, ничего не работает!». И вот тут — самый интересный момент: как оживить систему? А вот тут все зависит от уровня raid... Если raid-1 — вы это сможете сделать своими силами. В любом другом случае, вам поможет сторонняя контора (дата-центр) за ~ 1000$.

    А так как в большинстве случаев, никто не следит за состоянием своего raid, то и вопрос о том, какой raid использовать имеет 1 ответ: Только raid-1. Если используете любой другой: то будьте готовы выложить от 1000$ за его восстановление (если не следите за raid).

    Брр... накипело, вот и написал. Автору стоит написать статью и о ПРАКТИЧЕСКОМ применении raid.

    Еще раз: За любым raid НАДО следить, иначе ... тут цена вопроса. Raid-1 — самое дешевое его решение :)

  2. konst, вы не обратили внимание на начало названия всех статей — «Введение в RAID»? Этот материал рассчитан на тех, кто абсолютно ничего не знает о RAID. О каком практическом применении RAID может идти речь, когда человек даже не знает что это такое?

    О том, что за RAID нужно следить — это как раз и есть то самое очевидное. А за чем следить не надо? За любым имеющим функциональное значение техпроцессом нужно следить и периодически контролировать его, это истина, без понимания которой, человеку нечего делать в системном администрировании.

    Статья на тему «надо следить» — за рамками тематики этого сайта. «Надо следить» — это для ИТ-менеджеров, которых, как раз, мало волнует техническая часть. Этот блог ориентирован на начинающих технарей, но никак не на организаторов их деятельности.

    О «практическом применении» (коим является настройка и администрирование RAID) будет позже, как только появится свободное время.

Комментарии запрещены.