【RAID】RAIDの基礎知識とレベル毎の特徴~高信頼化技術の種類!

【RAID】RAIDの基礎知識とレベル毎の特徴~高信頼化技術の種類!
ハテオ君

システムの勉強をしているけどRAIDの基礎知識や種類があまり理解できないなぁ

今回はこの悩みを解決していきます。

本日の記事テーマ

RAIDの基礎とレベル毎の特徴~高信頼化技術の種類まで徹底解説!

システムの勉強しているときに良く出てくる言葉が「RAID」です。

RAIDは補助記憶装置の信頼性やアクセススピードを上げるための機能を持っています。

また、信頼性を上げるために使われる技術も解説して行きますので、RAIDについて知りたい方は今回の記事を参考にしてください。

本日の記事内容

  • RAIDとは何か?
  • RAIDのレベルとその概要
  • 高信頼化技術の種類

記事の最後には、今回の内容に関しての確認問題も用意していますので、インプットとアウトプットとしても是非活用してみてください。

元中卒の私が誰でも理解できるように解説していきます。

それでは早速見ていきましょう!

黄島 成

RAIDとは何か?

RAIDとは何か?

RAID「Redundant Arrays of Inexpensive Disks(リダイレクト・アレイ・オブ・インテクスペンシブ・ディスクズ)」の頭文字をとった略で「レイド」と呼びます。

RAIDは、複数台の磁気ディスク装置を使い「アクセスの高速化」や「高信頼性を実現」する技術で、ディスクアレイとも呼ばれています。

RAIDのメリットと特徴

複数台の磁気ディスクを組み合わせたRAIDにすると大きなメリットが生じます。

メリット①データの復旧

磁気ディスクが故障したとしてもその磁気ディスクを交換することですぐに元通りにデータを復旧することが可能です。

また、特定の磁気ディスクが故障したり復旧中の最中でも別の磁気ディスクがあるため、問題なくデータにアクセスすることができます。

メリット②高速化

RAIDには、送られてきたデータを自動で分散し複数の磁気ディスクへ一度に書き込むことのできる機能があります。

分散して一度にデータを書き込むことで、1つにお磁気ディスクにデータを書き込むよりもデータ高速で書き込みが可能となる。

メリット③冗長性

耐障害性を高めるため予備システムを準備しシステム全体を二重化することをIT業界では冗長性と呼ぶ。

冗長性がある」という言葉は、安全性と信頼性が高いという意味になります。

RAIDは、複数台の磁気ディスク装置を使うことで冗長化をして冗長性を確保していることにつながる。

しかし、RAIDにはいくものレベルに分かれており、冗長性を高めれば高めるほど導入コストが高くなるというデメリットもあります。

RAIDのレベルとその概要

RAIDのレベルとその概要

RAIDは、データ及び冗長ビットの記録方法と記憶位置の組み合わせに基づいて、RAID0~RAID5までの6種類が存在します。

主に使用される代表的なRAIDは「RAID0、 RAID1、RAID3、 RAID5」がです。順番に見て行きましょう。

RAID0

データをブロック単位に複数の磁気ディスクに分散して記録する(ストライピング)

アクセスを並列的に行うことでアクセスの高速化が図れる。

しかし、1台の故障が発生すると、全体の故障につながるため信頼性が低くなる。

RAID1

同じデータを同時に別々の磁気ディスクに書き込む(ミラーリング)

もし1台に故障が発生しても、もう1台からデータを読むことができる。

信頼性が高くなるが、使用効率が低くなる。

RAID3

データをバイト単位でストライピングし、1台をエラー訂正用のパリティ情報記録用として固定する。

もし1台に故障が発生しても、残ったデータとパリティ情報からデータを復旧することができる。

RAID5

RAID3のパリティ情報記録用の磁気ディスクを固定せず、データを同様にパリティ情報もブロック単位に分散し、アクセスが特定の磁気ディスクに集中しないようにする。

アクセスの高速化と信頼性の向上の両方共実現できる。

以下の図は、4台でRAID5を構成した例です。

RAID5図

ディスクDのパリティ1にデータ1、デー タ2、データ3のブロックのパリティ情報が記録されています。

高信頼化技術の種類

高信頼化技術の種類

システムの信頼性向上のためには、大きく分けて次のようなものがあります。

高信頼化技術の種類

  • フォールトアボイダンス (fault avoidance)
  • フォールトトレランス (fault tolerance)
  • フェールセーフ (fail safe)
  • フェールソフト (fail soft)
  • フールプルーフ (fool proof)
  • BCP(Business Continuity Plan)

順番に見て行きましょう。

①:フォールトアボイダンス(fault avoidance)

フォールトアボイダンスは、障害が起きないようにする対策です。

構成部品の信頼性を高めたり、定期保守を組み入れたりして、故障そのものを排除するという考え方です。

②:フォールトトレランス(fault tolerance)

フォールトトレランスは、障害が起きてもシステムを動かし続けるための対策です。

構成部品を多重化して、故障しても耐えきるという考え方です。

③:フェールセーフ(fail safe)

フェールセーフ(fail safe)は、システムの一部が故障したとき、システム全体に致命的影響を与えないよう、あらかじめ定めた安全な状態に移行します。

故障したときは、安全重視という考え方です。

④:フェールソフト(fail soft)

フェールソフト(fail soft)は、システムの一部が故障したとき、機能を低下させてもシス テムの運転を継続します。

故障したときは、継続重視という考え方です。

なお、システム を部分的に停止させることを縮退運転と言います。

⑤:フールプルーフ(fool proof)

フールプルーフ(fool proof)は、誤動作が起こりにくいように設計します。

意図していない操作をしても故障しないという考え方です。

例えば、石油ストーブは倒れると火が消えるようになっています。これはフェールセーフ。

ジェット機は、エンジンがいくつか止まっても一つだけのエンジンで飛行は続けられるようになっています。これはフェールソフト。

消化器は、ピンを抜かない限り消化液がでないようになっています。これはフールプルーフ。

⑥:BCP(Business Continuity Plan:事業継続計画)

BCPとは、災害やシステム障害などの緊急事態に備えて、事前に決めておく行動計画のこ とです。

事業が中断する原因やリスクを想定し、未然に回避したり、速やかに回復できるように方針や行動手順を決めておきます。

BCPを策定し、運用状況を評価して見直しを図る仕組みを BCM(Business Continuity Management:事業計画管理)と言います。

今回のまとめ&確認問題

【RAID】RAIDの基礎知識とレベル毎の特徴~高信頼化技術の種類!まとめ

RAIDについては上記内容で以上となります。

それではまず今回の内容をまとめていきましょう。

まとめ

  • RAIDは「高信頼の実現」「アクセスの高速化」の機能
  • RAIDのレベルはRAID0、 RAID1、RAID3、 RAID5が代表的
  • RAID0:データをブロック単位に複数の磁気ディスクに分散して記録する
  • RAID1:同じデータを同時に別々の磁気ディスクに書き込む
  • RAID3:データをバイト単位でストライピングし、1台をエラー訂正用のパリティ情報記録用として固定する
  • RAID5:データを同様にパリティ情報もブロック単位に分散し、アクセスが特定の磁気ディスクに集中しないようにする
  • 高信頼化技術の種類は主に6つある

今回の確認問題「アウトプット用

確認問題

システム確認問題③

「次へ」で問題スタート!

①解説

【問題①】

データを分散して複数の磁気ディスクに書き込むことによって、データ入出力の高速化を図る方式はどれか。

:ストライピング 正解◯
:スワッピング 不正解×
:ディスクキャッシュ 不正解×
:ミラーリング 不正解×

【解説】

データを分散して複数の磁気ディスクに書き込むことによって、データ入出力の高速化を図る方式はどれか。

結論この答えは「ア:ストライピング」です。

ストライピングはRAID0の機能として挙げられます。

ストライピングの特徴

データをブロック単位に複数の磁気ディスクに分散して記録することでアクセスを並列的に行うことでアクセスの高速化が図れる。しかし、1つの故障が発生すると、全体の故障につながるため信頼性が低くなる。

②解説

【問題②】

仮想化マシン環境を物理マシン 20 台で運用しているシステムがある。次の運用条件のとき、物理マシンが最低何台停止すると縮退運転になるか。
〔運用条件〕
1.物理マシンが停止すると、そこで稼働していた仮想マシンは他の全ての物理マシンで均等に稼働させ、使用していた資源も同様に配分する。
2.物理マシンが 20 台のときに使用する資源は、全ての物理マシンにおいて70%である。
3.1 台の物理マシンで使用している資源が90%を超えた場合、システム全体が縮退運転となる。
(1)~(3)以外の条件は考慮しなくてよい。

:2 不正解×
:3 不正解×
:4 不正解×
:5 正解◯

【解説】

20台の物理マシン上でそれぞれ70%の資源が使用されているため、システムが稼働するために必要となる総資源量は以下通り

20台×70%=1,400(%)

物理マシン1台の資源量を基準とすると1,400%(物理マシン14台分の資源)になります。

x台の物理マシンが停止したとき、この資源量は残りの物理マシン数「20-x台」に均等に割り振られることになるので、各マシンの資源使用率を90%以下にするには以下計算となる。

1,400÷(20-x)≦90
1,400≦90(20-x)
1,400≦1,800-90x
90x≦400
x≦4.444…(台)

最大で4台までの停止が許容できることになります。

つまり物理マシンの資源使用率が90%を超え、縮退運転に移行するのは停止台数が5台になった時点です。

なので答えは「」となる。

③解説

【問題③】

フェールセーフ設計の考え方に該当するものはどれか。

:作業範囲に人間が入ったことを検知するセンサが故障したとシステムが判断した場合、ロボットアームを強制的に停止される。
正解〇
:数字入力フィールドに数字以外のものが入力された場合、システムから警告メッセージを出力して正しい入力を要求する。
不正解× フールフループの考え方
:専用回線に障害が発生した場合、すぐに公衆回線に切り替え、システムの処理機能が低下しても処理を続行する。
不正解× フェールソフトの考え方
:データ収集システムでデータ転送処理に障害が発生した場合、データ入力処理だけを行い、障害復旧時にまとめて転送する。
不正解× フェールソフトの考え方

【解説】

フェールセーフ(fail safe)は、システムの一部が故障したとき、システム全体に致命的影響を与えないよう、あらかじめ定めた安全な状態に移行します。

故障したときは、安全重視という考え方です。

例えば、工業用機械で進入禁止区域をセンサーで監視し、人や物の侵入を感知したときには機械を緊急停止するというような設計がフェールセーフの実践例です。

つまり答えは「」となる。

最後まで読んでいただきありがとうございました!

今回の内容が、役に立ったな!と思ったらシェア&ブクマ登録よろしくお願いします。

また、質問や問い合わせに関しては、コメント欄かお問い合わせフォームを活用ください。

それではまたお会いしましょう。

黄島 成

-システム
-