RAID 50(レイド ゴーゼロ)とは | 意味や読み方など丁寧でわかりやすい用語解説
RAID 50(レイド ゴーゼロ)の意味や読み方など、初心者にもわかりやすいように丁寧に解説しています。
読み方
日本語表記
レイド50 (レイドフィフティ)
英語表記
RAID 50 (レイドゴーマル)
用語解説
RAID 50は、複数のRAID 5アレイを組み合わせて、さらにそれらをRAID 0としてストライピングするRAID(Redundant Array of Independent Disks)レベルの一つだ。この方式は、RAID 5の持つ耐障害性と容量効率の良さに、RAID 0の持つ高いデータ読み書き性能を組み合わせることで、エンタープライズ環境で要求される高性能かつ高信頼なストレージシステムを構築することを目指している。
まず、RAID 50を理解するためには、その基礎となるRAID 0とRAID 5の仕組みを把握しておく必要がある。RAID 0は「ストライピング」と呼ばれる技術で、複数のディスクにデータを分散して書き込むことで、あたかも一台の高速なディスクであるかのように見せかける。これにより、データの読み書きが複数のディスクで並行して行われるため、非常に高い性能を発揮する。しかし、RAID 0には冗長性が一切なく、構成するディスクのうち一台でも故障すると、全てのデータが失われてしまうという致命的な欠点がある。そのため、単体で重要なデータを扱う用途には向かない。
一方、RAID 5は「ストライピングとパリティ」を組み合わせた方式だ。データブロックだけでなく、そのデータブロックから計算される「パリティ」と呼ばれる冗長情報も複数のディスクに分散して書き込む。パリティは、元のデータが失われた場合にそれを復元するための情報であり、RAID 5では構成するディスクのうち一台が故障しても、残りのディスクとパリティ情報から失われたデータを再構築(リビルド)できる耐障害性を持つ。RAID 5はRAID 0ほどの極端な高速性はないものの、ディスクへの読み込み性能は高く、書き込み性能はパリティ計算のオーバーヘッドがあるためRAID 0に劣るが、実用上十分な性能を発揮する。また、必要なディスク台数は最低3台で、パリティ情報のためにディスク1台分の容量が消費されるが、RAID 1(ミラーリング)と比べて容量効率が良いという特徴もある。
RAID 50は、これらRAID 0とRAID 5の利点を組み合わせた方式である。具体的には、まず複数のRAID 5グループ(またはアレイ)を構築する。例えば、3台のディスクで構成されるRAID 5アレイを二つ作る、といった具合だ。次に、これら複数のRAID 5アレイをあたかも一つのディスクグループであるかのように扱い、それらをRAID 0としてストライピングする。つまり、「RAID 5のアレイを複数作り、それらをRAID 0で束ねる」という構造になる。
この構成により、RAID 50はいくつかの明確なメリットを提供する。第一に、高いデータ読み書き性能だ。複数のRAID 5アレイにデータをストライピングすることで、RAID 5単体よりも多くのディスクで並行処理が行われるため、特にシーケンシャルアクセスにおいて大幅な性能向上が期待できる。これは、RAID 0が持つ高速性の恩恵をRAID 5アレイ全体で受ける形になる。第二に、優れた耐障害性である。RAID 50は各RAID 5グループ内でディスク1台の故障に耐えられる。さらに、もし異なるRAID 5グループに属するディスクが故障した場合であれば、それぞれのグループが持つ耐障害性により、複数台のディスクが故障してもデータが失われることなく運用を継続できる可能性がある。これは、RAID 0単体では考えられない高い信頼性だ。第三に、RAID 1+0(RAID 10)など他のネスト型RAIDレベルと比較して、容量効率が良い場合がある。RAID 10はミラーリングとストライピングを組み合わせるため、ディスク容量の半分が冗長性のために消費されるが、RAID 50はパリティ分散方式であるため、冗長性のために消費される容量はRAID 5グループ数に依存するものの、全体としてより多くの実効容量を確保できることが多い。
しかし、RAID 50にはデメリットも存在する。最も顕著なのは、必要なディスク台数が増え、それに伴いコストが上昇し、システムの構築と管理が複雑になることだ。RAID 5グループの数と各グループ内のディスク台数によって全体のディスク台数が決まるため、大規模なシステムになりがちだ。また、耐障害性に関して注意すべき点がある。RAID 50は高い耐障害性を持つものの、同じRAID 5グループ内で2台以上のディスクが同時に故障した場合は、そのRAID 5グループが機能不全に陥り、データが失われてしまう。異なるグループに属するディスクであれば複数台故障に耐えられる可能性があるが、同一グループ内の複数故障には弱い。さらに、ディスクが大容量化している現代において、ディスク故障時のリビルド(データ再構築)にかかる時間が非常に長くなる傾向がある。リビルド中はストレージシステム全体の性能が低下するだけでなく、リビルド中に別のディスクが故障する「二次故障」のリスクが高まり、その結果データ損失につながる可能性も存在する。
これらの特性から、RAID 50は主に、大規模データベース、データウェアハウス、高速なトランザクション処理が求められるアプリケーションなど、高いデータアクセス性能と同時に高い信頼性が要求されるエンタープライズ環境で採用されることが多い。多数のディスクを利用することで、膨大なデータを高速に処理しつつ、万一のディスク故障にも備えることが可能になる。