Поняття RAID

Матеріал з Wiki TNEU
Перейти до: навігація, пошук

RAID (англ. redundant array of independent/inexpensive disks) — надлишковий масив незалежних/недорогих дисків для комп'ютера.Технологія RAID уперше розроблена в 1987 співробітниками Каліфорнійського університету в Беркли. Основна мета це забезпечення надійності зберігання даних в дисковій пам'яті і підвищення продуктивності персональних комп'ютерів. Архітектура RAID, яка визначає різні способи об'єднання декількох жорстких дисків в єдину систему так, щоб вона функціонувала як один диск. Спільна робота дисків в масивах RAID організовується із застосуванням паралельного або незалежного доступу. Відповідно до різних типів доступу до запису і прочитування даних існують різні типи RAID -массивов. Крім того, рівні RAID розрізняються способами формування і розміщення надлишкових даних. Останні можуть знаходитися або на спеціально виділеному диску, або розподілятися між усіма дисками. Простим з цих способів є повне дублювання (надмірність = 100%) або зеркалирование. Прикладом є конструкція накопичувачів з дзеркальними дисками. Спочатку було визначено шість рівнів RAID, пізніше з'явилися додаткові змішані рівні (всього визначено 8 рівнів), а також їх комбінації.

Рівні RAID

RAID рівня 0

Дисковий масив без відмовостійкості (Striped Disk Array without Fault Tolerance).

Дисковий масив без надлишкового зберігання даних. Інформація розбивається на блоки, які одночасно записуються на окремі диски, що забезпечує підвищення продуктивності. Такий спосіб зберігання інформації ненадійний, оскільки поломка одного диска призводить до втрати усієї інформації.

За рахунок можливості одночасного введення/виводу з декількох дисків масиву RAID 0 забезпечує максимальну швидкість передачі даних і максимальну ефективність використання дискового простору, оскільки не вимагається місця для зберігання контрольних сум. Реалізація цього рівня дуже проста. RAID 0, як правило, застосовується в тих областях, де вимагається швидка передача великого об'єму даних. Для реалізації масиву вимагається не менше двох вінчестерів.

Переваги: найвища продуктивність в додатках, що вимагають інтенсивної обробки запитів введення/виводу і даних великого об'єму; простота реалізації; низька вартість; максимальна ефективність використання дискового простору - 100%.

Недолік: відмова одного диска спричиняє за собою втрату усіх даних масиву.


RAID рівня 1

Дисковий масив із зеркалированием (Mirroring & Duplexing)

Дисковий масив з дублюванням інформації (зеркалированием даних). У простому випадку два накопичувачі містять однакову інформацію і є одним логічним диском. При виході з ладу одного диска його функції виконує інший. Для реалізації масиву вимагається не менше двох вінчестерів.

Переваги: простота реалізації; простота відновлення масиву у разі відмови.

Недоліки: висока вартість - 100-процентна надмірність; невисока швидкість передачі даних.


RAID рівня 2

Відмовостійкий дисковий масив з використанням коду Хемминга (Hamming Code ECC)


Схема резервування даних з використанням коду Хэмминга (Hamming code) для корекції помилок. Потік даних розбивається на слова - причому розмір слова відповідає кількості дисків для запису даних. Для кожного слова обчислюється код корекції помилок, який записується на диски, виділені для зберігання контрольної інформації. Їх число дорівнює кількості біт в слові контрольної суми. Якщо слово складається з чотирьох біт, то під контрольну інформацію відводиться три диски. RAID 2 - один з небагатьох рівнів, що дозволяють виявляти подвійні помилки і виправляти "на льоту" поодинокі. При цьому він є самим надлишковим серед усіх рівнів з контролем парності. Ця схема зберігання даних не отримала комерційного застосування, оскільки погано справляється з великою кількістю запитів.

Переваги: досить проста реалізація; корекція помилок "на льоту"; дуже висока швидкість передачі даних; при збільшенні кількості дисків накладні витрати зменшуються.

Недоліки: низька швидкість обробки запитів; висока вартість; велика надмірність.


RAID рівня 3

Відмовостійкий дисковий масив з паралельною передачею даних і парністю (Parallel Transfer Disks with Parity)


Відмовостійкий масив з паралельним введенням/виводом даних і диском контролю парності. Потік даних розбивається на порції на рівні байт (хоча можливо і на рівні біт) і записується одночасно на усі диски масиву, окрім одного. Один диск призначений для зберігання контрольних сум, що обчислюються при записі даних. Поломка будь-якого з дисків масиву не приведе до втрати інформації.

Цей рівень має набагато меншу надмірність, чим RAID 2. В другому рэйде більшість дисків, що зберігають контрольну інформацію, потрібні для визначення несправного розряду. Як правило, RAID -контроллеры можуть отримати дані про помилку за допомогою механізмів відстежування випадкових збоїв. За рахунок розбиття даних на порції RAID 3 має високу продуктивність. Оскільки при кожній операції введення/виводу виробляється звернення практично до усіх дисків масиву, то одночасна обробка декількох запитів неможлива.

Цей рівень підходить для додатків з файлами великого об'єму і малою частотою звернень (в основному це сфера мультимедіа). Використання тільки одного диска для зберігання контрольної інформації пояснює той факт, що коефіцієнт використання дискового простору досить високий (як наслідок цього - відносно низька вартість). Для реалізації масиву вимагається не менше трьох вінчестерів.

Переваги: відмова диска мало впливає на швидкість роботи масиву; висока швидкість передачі даних; високий коефіцієнт використання дискового простору.

Недоліки: складність реалізації; низька продуктивність при великій інтенсивності запитів даних невеликого об'єму.


RAID рівня 4

Відмовостійкий масив незалежних дисків із загальним диском парності (Independent Data Disks with Shared Parity Disk)


Цей масив дуже схожий на рівень RAID 3. Потік даних розділяється не на рівні байтів, а на рівні блоків інформації, кожен з яких записується на окремий диск. Після запису групи блоків обчислюється контрольна сума, яка записується на виділений для цього диск. У RAID 4 можливе одночасне виконання декількох операцій читання. Цей масив підвищує продуктивність передачі файлів малого об'єму (за рахунок розпаралелювання операції прочитування). Але оскільки при записі повинна змінюватися контрольна сума на виділеному диску, одночасне виконання операцій неможливе (у наявності асиметричність операцій введення і виводу). Цей рівень має майже усі недоліки RAID 3 і не забезпечує переваги в швидкості при передачі даних великого об'єму. Схема зберігання розроблялася для додатків, в яких дані спочатку розбиті на невеликі блоки, тому немає необхідності розбивати їх додатково. Ця схема зберігання даних має невисоку вартість, але її реалізація досить складна, як і відновлення даних при збої.


Переваги: висока швидкість передачі даних; відмова диска мало впливає на швидкість роботи масиву; високий коефіцієнт використання дискового простору.


Недоліки: досить складна реалізація; дуже низька продуктивність при записі даних; складне відновлення даних.


RAID рівня 5

Відмовостійкий масив незалежних дисків з розподіленою парністю (Independent Data Disks with Distributed Parity Blocks)

Найпоширеніший рівень. Блоки даних і контрольні суми циклічно записуються на усі диски масиву, відсутній виділений диск для зберігання інформації про парність, немає асиметричності конфігурації дисків.

У разі RAID 5 усіх дисків масиву мають однаковий розмір - але один з них невидимий для операційної системи. Наприклад, якщо масив складається з п'яти дисків місткістю 10 Гб кожен, то фактично розмір масиву дорівнюватиме 40 Гб - 10 Гб відводиться на контрольні суми. У загальному випадку корисна місткість масиву з N дисків дорівнює сумарній місткості N - 1 диска.

Найбільший недолік рівнів RAID від 2-го до 4-го - це наявність окремого диска (чи дисків), що зберігає інформацію про парність. Швидкість виконання операцій прочитування досить висока, оскільки не вимагає звернення до цього диска. Але при кожній операції запису на нім змінюється інформація, тому схеми RAID 2-4 не дозволяють проводити паралельні операції запису. RAID 5 не має цього недоліку, оскільки контрольні суми записуються на усі диски масиву, що робить можливим виконання декількох операцій читання або запису одночасно. RAID 5 має досить високу швидкість запису/читання і малу надмірність.

Переваги: висока швидкість запису даних; досить висока швидкість читання даних; висока продуктивність при великій інтенсивності запитів читання/запису даних; високий коефіцієнт використання дискового простору.

Недоліки: низька швидкість читання/запису даних малого об'єму при одиничних запитах; досить складна реалізація; складне відновлення даних.


RAID рівня 6

Відмовостійкий масив незалежних дисків з двома незалежними розподіленими схемами парності (Independent Data Disks with Two Independent Distributed Parity Schemes)


RAID 6 - це відмовостійкий масив незалежних дисків з розподілом контрольних сум, вичислених двома незалежними способами. Цей рівень багато в чому схожий з RAID 5. Тільки у нім використовується не одна, а дві незалежні схеми контролю парності, що дозволяє зберігати працездатність системи при одночасному виході з ладу двох накопичувачів. Для обчислення контрольних сум в RAID 6 використовується алгоритм, побудований на основі коду Рида-Соломона (Reed - Solomon).

Цей рівень має дуже високу відмовостійкість, велику швидкість прочитування (дані зберігаються блоками, немає виділених дисків для зберігання контрольних сум). В той же час із-за великого об'єму контрольної інформації RAID 6 має низьку швидкість запису. Він дуже складний в реалізації, характеризується низьким коефіцієнтом використання дискового простору : для масиву з п'яти дисків він складає усього 60%, але із зростанням числа дисків ситуація виправляється.


RAID 6 за багатьма характеристиками програє іншим рівням, тому на сьогодні не отримав комерційного застосування.

Переваги: висока відмовостійкість; досить висока швидкість обробки запитів;

Недоліки: низька швидкість читання/запису даних малого об'єму при одиничних запитах; дуже складна реалізація; складне відновлення даних; низька швидкість запису даних.


RAID рівня 7

Отказоустойчивый массив, оптимизированный для повышения производительности (Optimized Asynchrony for High I/O Rates as well as High Data Transfer Rates)

В отличие от других уровней, RAID 7 не является открытым индустриальным стандартом — это зарегистрированная торговая марка компании Storage Computer Corporation. Массив основывается на концепциях, использованных в третьем и четвертом уровнях. Добавилась возможность кэширования данных. В состав RAID 7 входит контроллер со встроенным микропроцессором под управлением операционной системы реального времени (real-time OS). Она позволяет обрабатывать все запросы на передачу данных асинхронно и независимо. Блок обчислення контрольних сум інтегрований з блоком буферизації; для зберігання інформації про парність використовується окремий диск, який може бути розміщений на будь-якому каналі. RAID 7 має високу швидкість передачі даних і обробки запитів, хорошу масштабованість. Найбільшим недоліком цього рівня є вартість його реалізації.

Переваги: дуже висока швидкість передачі даних і висока швидкість обробки запитів (у 1,5.6 разів вище за інші стандартні рівні RAID); хороша масштабованість; значно збільшена (завдяки наявності кеша) швидкість читання даних невеликого об'єму; відсутність необхідності в додатковій передачі даних для обчислення парності.

Недоліки: власність однієї компанії; складність реалізації; дуже висока вартість на одиницю об'єму; не може обслуговуватися користувачем; необхідність використання блоку безперебійного живлення для запобігання втраті даних з кеш-пам'яті; короткий гарантійний термін.


Комбіновані і додаткові рівні RAID

RAID 0/1 - комбінація рівнів RAID 0 і 1, цей рівень забезпечує надмірність за рахунок дзеркалювання.


RAID 10 - комбінація технологій RAID 1 і RAID 0. тобто дзеркалювання групи дисководів, об'єднаних в RAID 0 для забезпечення максимальної швидкодії. Цей рівень забезпечує надмірність за рахунок дзеркального відображення.


RAID 30 - тобто використовується контрольна сума для групи дисководів, об'єднаних в RAID 0 для забезпечення максимальної швидкодії. Інформація про парність може використовуватися для відновлення даних.


RAID 50 - комбінація рівнів RAID 5 і 0 тобто використовується переміщувана контрольна сума для групи дисководів, об'єднаних в RAID 0 для забезпечення максимальної швидкодії. Інформація про парність може використовуватися для відновлення даних.


RAID 53 - комбінація рівнів RAID 3 і 0, при якій, якщо диски розташувати схематично у вигляді прямокутної матриці, то стовпці складатимуть масиви RAID 3 (у деяких виробників - RAID 5), а ряди - масиви RAID 0. Такий масив досить доріг в реалізації, до того ж усі шпинделі дисків мають бути синхронизованы, що обмежує вибір дисків.

Переваги: має таку ж відмовостійкість, що і RAID 3, при дещо вищій швидкості читання і запису.

Недоліки: висока вартість, низький коефіцієнт використання дискового простору.

Особисті інструменти
Простори назв

Варіанти
Дії
Навігація
Інструменти