Webエンジニア向けプログラミング解説動画をYouTubeで配信中!
▶ チャンネル登録はこちら

RAID 4(レイドフォー)とは | 意味や読み方など丁寧でわかりやすい用語解説

RAID 4(レイドフォー)の意味や読み方など、初心者にもわかりやすいように丁寧に解説しています。

作成日: 更新日:

読み方

日本語表記

レイドフォー (レイドフォー)

英語表記

RAID 4 (レイドフォー)

用語解説

ITの世界では、データを安全に保管し、かつ高速に利用できるストレージシステムが常に求められている。RAID(Redundant Array of Independent Disks)は、複数の独立したディスクを組み合わせることで、データの冗長性(耐障害性)を高めたり、データ転送速度を向上させたりする技術群の総称だ。RAIDには様々な方式があり、それぞれ特徴が異なる。RAID 4もその一つだが、現在ではあまり使われることのない、特定の課題を抱えた方式として知られている。

RAID 4は、複数のディスクにデータを分散して書き込み、さらに専用のディスクに「パリティ」と呼ばれる冗長情報を記録することで、1台のディスクが故障してもデータを復旧できるように設計された方式だ。基本的な動作としては、データをブロック単位に分割し、それを複数のデータディスクに分散して書き込む。例えば、3台のデータディスクがある場合、データAをディスク1に、データBをディスク2に、データCをディスク3に書き込むといった形だ。これと並行して、これらデータブロックから計算されるパリティ情報を、専用のパリティディスクに書き込む。パリティは、データディスクの内容から排他的論理和(XOR)という演算で生成される。このパリティ情報があるおかげで、もしデータディスクの1台が故障してデータが失われても、残りのデータディスクとパリティディスクの情報を用いて、失われたデータを再構築できるのだ。同様に、パリティディスク自体が故障しても、データディスクの情報からパリティを再計算できるため、データの安全性が保たれる。

RAID 4の動作をもう少し詳しく見てみよう。データを書き込む際には、まず複数のデータディスクにデータをブロック単位で書き込む。これらのデータブロックが書き込まれると、それらのデータから新しいパリティが計算される。計算されたパリティは、専用のパリティディスクに書き込まれる。この書き込みプロセスでは、データとパリティの両方が更新されるため、複数のディスクへのアクセスが発生する。一方、データを読み出す際には、データは複数のデータディスクに分散して保存されているため、複数のディスクから同時にデータを読み出すことが可能だ。これにより、理論上はデータディスクの台数に応じて読み出し速度が向上する。

RAID 4は単一のディスク故障に対して高い耐障害性を持つ点が大きな利点だが、その書き込み性能には致命的な問題があった。特に、小さなデータをランダムに書き込む場合、この問題が顕著になる。新しいデータを書き込む際、システムは以下のステップを踏む必要がある。まず、書き込み対象のデータブロックが保存されているデータディスクから古いデータを読み出す。同時に、パリティディスクから古いパリティ情報を読み出す。次に、古いデータ、新しいデータ、そして古いパリティ情報を使って、新しいパリティ情報を計算する。最後に、新しいデータをデータディスクに書き込み、計算された新しいパリティをパリティディスクに書き込む。この一連のプロセスは「Read-Modify-Write(RMW)」と呼ばれる。

このRMW処理がRAID 4の書き込み性能のボトルネックとなる。なぜなら、すべての書き込み操作において、必ずパリティディスクにアクセスしてパリティ情報を更新しなければならないからだ。複数のデータディスクへの書き込みが同時に発生しても、パリティディスクへの書き込みは常に1箇所に集中してしまう。これは、ちょうど一本の狭い通路に大勢の人が殺到するようなもので、処理が渋滞し、全体としての書き込み速度が低下する。特に、多くのユーザーやアプリケーションが同時に書き込みを行うような環境では、パリティディスクが「単一のボトルネック」となり、システムの応答性が著しく悪化する原因となる。

このような特性から、RAID 4はほとんど普及しなかった。高い読み出し性能と単一ディスク故障に対する耐障害性というメリットはあったものの、その書き込み性能の課題があまりにも大きすぎたのだ。このRAID 4の課題を解決するために考案されたのが、RAID 5だ。RAID 5では、パリティ情報を専用のディスクに集約するのではなく、すべてのデータディスクに分散して配置する。これにより、パリティディスクがボトルネックとなる問題を解消し、書き込み性能を大幅に改善した。そのため、現在ではRAID 4が使われることはまれで、そのコンセプトはRAID 5へと進化し、より広く利用されている。RAID 4は、RAID技術の発展において、重要な課題を浮き彫りにした過渡期の技術として位置づけられる。

関連コンテンツ