Резервированные системы хранения данных и RAID-массивы: комплексный обзор

COMMON 7 мин. на чтение

Не зря нынешнее время часто называют Информационным веком. Ведь информация, подчас, стоит очень дорого и её потеря или кража может стать непоправимой для её обладателя.
Поэтому всё большей популярностью пользуются специализированные системы хранения данных и невозможно переоценить важность их надежности и отказоустойчивости. Системы хранения данных с избыточностью, в которых на переднем плане стоят массивы RAID (Redundant Array of Independent Disks), стали неотъемлемыми компонентами современной вычислительной инфраструктуры. В этой статье мы кратко пройдёмся по истории, развитии и перспективам систем избыточного хранения данных, проливая свет на их значение в различных технических областях.

 


Историческая перспектива

С древности люди стали записывать и хранить информацию, но катаклизмы, пожары, наводнения и другие бедствия часто уничтожали носители, на которых она была записана.
Истоки избыточного хранения данных можно проследить еще на заре вычислительной техники, когда стала очевидной необходимость в надежном хранении данных, которое будет заключаться в многократном дублировании одной и той-же информации, чтобы в случае уничтожения одной копии - вся информация была сохранена в другом месте. В 1960-х и 1970-х годах в больших мейнфреймах использовались элементарные методы резервирования, в основном полагавшиеся на процессы резервного копирования вручную. Однако по мере развития технологий росли и усложнения решений резервирования.

Концепция RAID была впервые представлена в 1987 году Дэвидом Паттерсоном, Гартом А. Гибсоном и Рэнди Кацем в Калифорнийском университете в Беркли. Первоначальная идея RAID заключалась в использовании нескольких дисков в массиве для повышения производительности и обеспечения отказоустойчивости. Это заложило основу для разработки различных уровней RAID, каждый из которых предлагает различное сочетание производительности, избыточности и емкости.

 


Эволюция уровней RAID


RAID 0: чередование для повышения производительности

RAID 0, простейшая форма RAID, предполагает распределение данных по нескольким дискам для повышения скорости чтения и записи. Хотя это повышает производительность, оно не обеспечивает избыточности. Если один диск выйдет из строя, все данные будут потеряны. Несмотря на недостаточную отказоустойчивость, RAID 0 по-прежнему используется в сценариях, где скорость имеет первостепенное значение, например при редактировании видео и рендеринге в реальном времени.


RAID 1: зеркалирование для резервирования

RAID 1 обеспечивает избыточность за счет зеркального отображения данных на двух дисках. В случае сбоя диска система плавно переключается на зеркальную копию. Хотя этот уровень избыточности достигается за счет уменьшения полезной емкости хранилища, RAID 1 остается популярным выбором для критически важных приложений, где целостность данных имеет первостепенное значение.


RAID 5: сбалансированная производительность и избыточность

RAID 5 сочетает в себе чередование и четность для достижения как производительности, так и избыточности. Данные и информация о четности распределяются по нескольким дискам, обеспечивая отказоустойчивость. В случае сбоя одного диска потерянные данные можно восстановить на остальных дисках. RAID 5 обеспечивает баланс между производительностью и избыточностью, что делает его пригодным для широкого спектра приложений.


RAID 6: улучшенная избыточность с двойной четностью

Чтобы устранить ограничения RAID 5, в RAID 6 реализована двойная четность. Это означает, что два диска могут выйти из строя без потери данных. Хотя RAID 6 обеспечивает повышенную отказоустойчивость, за это приходится платить снижением производительности записи из-за дополнительных вычислений четности. Этот уровень обычно используется в сценариях, где целостность данных имеет решающее значение, например в корпоративных решениях для хранения данных.


RAID 10: сочетание зеркалирования и чередования

RAID 10, часто называемый RAID 1+0, сочетает в себе зеркалирование RAID 1 и чередование RAID 0. Это приводит как к повышению производительности, так и к резервированию. Однако для RAID 10 требуется как минимум четыре диска, поскольку данные зеркалируются, а затем распределяются по зеркальным парам. Этот уровень популярен в средах, где производительность и отказоустойчивость одинаково важны.

 

 

Перспективы и вызовы

Новые технологии и резервирование

По мере развития технологий продолжают появляться новые решения для хранения данных и методы резервирования. Технологии энергонезависимой памяти (NVM), такие как 3D XPoint и память с фазовым изменением, обещают более высокую скорость и более высокий срок службы, чем традиционные жесткие диски (HDD) и твердотельные накопители (SSD). Интеграция этих технологий в резервные системы хранения может изменить представление о хранении данных в ближайшие годы.


Проблемы масштабируемости

Хотя RAID-массивы доказали свою эффективность в развертываниях малого и среднего масштаба, масштабируемость остается проблемой. Поскольку объемы данных продолжают стремительно расти, потребность в масштабируемых решениях резервирования становится более актуальной, чем когда-либо. Распределенные системы хранения и такие технологии, как стирающее кодирование, изучаются в качестве потенциальных альтернатив или дополнений к традиционным RAID для крупномасштабных развертываний.


Влияние виртуализации

Развитие технологий виртуализации изменило способы реализации и управления избыточными хранилищами. Виртуализированные среды хранения используют программно-определяемое хранилище (SDS) для эффективного объединения ресурсов хранения и управления ими. Этот сдвиг вводит новые аспекты избыточности, например, то, как виртуальные машины взаимодействуют с хранилищем и как обеспечить целостность данных в динамических виртуализированных средах.

 

 

В заключение отметим, что системы хранения данных с избыточностью, особенно RAID-массивы, значительно изменились с момента их создания. От базового зеркалирования до сложных схем четности — RAID адаптировался к меняющимся потребностям различных вычислительных сред. По мере развития технологий перспективы резервных систем хранения данных становятся все более впечатляющими: новые технологии и инновационные подходы обещают повышение производительности, масштабируемости и отказоустойчивости. Однако необходимо решить такие проблемы, как масштабируемость и влияние виртуализации, чтобы обеспечить постоянную эффективность решений избыточного хранения данных в условиях постоянно растущих потребностей в данных. Если мы посмотрим в будущее, синергия между развивающимися технологиями и устоявшимися принципами определит следующую главу в саге о избыточных системах хранения данных.

Nov. 11, 2023, 8:19 a.m.