Введение в RAID: RAID-5






RAID-5 похож на RAID-4, однако теперь для хранения информации о чётности данных используется не выделенный диск, а все диски, входящие в массив. Такой подход позволяет существенно повысить производительность записи в массив, по сравнению с RAID-4.



На картинке ниже (взято с Википедии, автор — Cburnett) проиллюстрирован принцип записи данных на четырёхдисковый массив RAID-5.

На приведённой картинке блоки чётности помечены буквой «p» в нижнем регистре. Обратите внимание на то, как блоки чётности разделены между всеми четырьмя дисками. Блоки, которые выстраиваются таким образом (обычно один блок на диск), как правило представляют «полоски» (stripe) данных. На картинке выше все блоки из одной полоски помечены одинаковым цветом. Размер полоски вычисляется следующим образом:

где n — количество дисков в массиве RAID-5. Внутри полоски все блоки кроме одного содержат непосредственно данные, а один оставшийся блок хранит в себе информацию о чётности всей полоски данных. Каждый раз, когда происходит изменение блока данных в полоске, блок чётности пересчитывается заново и обновляется (такая операция иногда называется «процессом чтения-изменения-записи»). Такой процесс требует некоторых накладных расходов, снижая производительность.

RAID-5 также имеет некоторые проблемы с записью небольших кусков информации, которые размером меньше, чем полоска данных массива, поскольку в таких случаях возникает необходимость вычислять чётность несколько раз, что соответственно нагружает RAID-контроллер дополнительной работой, поскольку процесс чтения-изменения-записи должен повторяться несколько раз в данном случае.

Ёмкость массива RAID-5 вычисляется подобно RAID-4 следующим образом:

Это означает, что общая ёмкость массива RAID-5 ограничена ёмкостью наименьшего диска (вы можете использовать диски разной ёмкости), входящего в его состав, умноженной на количество дисков минус один. «Минус один» — это один диск, используемый в каждой полоске данных для хранения блока чётности.

Используя RAID-5, вы можете потерять один диск, поскольку данные и блоки чётности, нужные для восстановления, могут быть найдены на оставшихся в живых дисках. Ко всему прочему, многие контроллеры RAID-5 обладают функцией т. н. «диска горячей замены» (hot-spare disk). Такой диск изначально физически подключён к контроллеру, но для хранения данных не используется. Если вдруг какой-то из дисков массива выйдет из строя, RAID-контроллер тут же подключит вместо него ранее не использовавшийся hot-spare диск.

После подключения hot-spare диска RAID-контроллер немедленно приступит к процессу перераспределения данных и блоков чётности на новый диск. Чтобы сделать это, контроллеру необходимо считать блоки данных и блоки чётности «живых» дисков и восстановить на основании них содержимое утерянного диска, записав его на hot-spare диск. Такая операция занимает достаточно много времени. Огромным преимуществом использования дисков горячей замены является то, что в случае отказа одного из основных дисков, все операции по восстановлению проводятся полностью автоматически.

RAID-5 применяется довольно долго и в течение этого времени зарекомендовал себя как очень надёжный способ хранения данных. Однако с течением времени обнаружилась проблема, возникающая при длительном использовании RAID-5. Суть проблемы описывается во многих источниках, например в этой статье. В двух словах суть проблемы состоит в следующем. Ёмкость дисков растёт быстрее, чем частота Unrecoverable Read Error (URE) — невосстанавливаемых ошибок чтения. Почти гарантировано, что до того, как наступит момент необходимости использования диска горячей замены, уже будут иметь место URE хотя бы на одном из дисков, что не даст восстановить данные без обращения к резервным копиям. Однако это тема отдельной статьи.

В Сети нет недостатка информации о RAID-5. Поищите и вы найдёте много мнений о применении RAID-5 от тех, кто делал это на практике, однако всегда обращайте внимание о каких конкретно типах приложений, использующих RAID-5 для хранения данных, идёт речь. Краткое описание плюсов и минусов использования RAID-5 можно найти, например, здесь.

Подытожим основные моменты, присущие RAID-5:

  • плюсы:
    • высокая надёжность хранения данных (вы не потеряете данные, если один диск массива выйдет из строя);
    • высокая скорость чтения;
    • лучшая, чем у RAID-4 скорость записи
  • минусы:
    • ограничения производительности записи из-за необходимости вычислять, пересчитывать и обновлять блоки чётности;
  • минимальное количество дисков в массиве: 3 (крайне желательно, чтобы они были одинаковыми).

Источник: Linux-Mag.Com