【ITニュース解説】A Practical Guide to Testing Association in 2x2 Tables: From Fisher’s Exact Test to the Chi-Square

2025年09月07日に「Dev.to」が公開したITニュース「A Practical Guide to Testing Association in 2x2 Tables: From Fisher’s Exact Test to the Chi-Square」について初心者にもわかりやすいように丁寧に解説しています。

作成日: 更新日:

ITニュース概要

2x2の表で二つの事象に関連があるか検証する方法を解説。サンプルサイズが小さい場合は正確なFisherの直接確率検定、サンプルサイズが大きい場合は近似的なカイ二乗検定が使える。ただし、期待値が小さい場合はFisherの直接確率検定が推奨される。効果量をp値とともに報告することが重要。

ITニュース解説

この記事は、2x2の分割表における関連性を検証するための統計的手法について解説している。2x2分割表とは、例えば、ある治療の効果を調べるときに、治療を受けた人と受けなかった人、そしてそれぞれが死亡したかどうかというように、2つのカテゴリ変数の関係を表す表のことだ。この記事では、このような場合に、2つの変数間に関連があるかどうかを判断するための主要な方法を紹介している。

まず、最も基本的な手法として、Fisherの正確検定が挙げられている。これは、帰無仮説(つまり、治療に効果がないという仮説)が正しいと仮定した場合に、実際に観察されたデータがどれくらいありえないかを計算する。具体的には、各グループの人数とイベントの総数を固定した上で、治療群で特定の数の死亡者が出現する確率を、超幾何分布を用いて計算する。この検定は、サンプルサイズが小さい場合や、イベントがまれな場合に特に有効だが、保守的であるため、検出力が低いという欠点もある。

次に、Barnardの非条件検定が紹介されている。これは、Fisherの正確検定よりも検出力が高い正確検定で、各グループを独立な二項分布として扱う。近年のソフトウェアの発展により、計算が容易になった。

さらに、漸近的な手法として、プールされた2標本Z検定が解説されている。これは、2つの独立した比率の差を検定するための古典的な方法だ。まず、プールされた比率を計算し、次にプールされた標準誤差を計算する。そして、Zスコアを計算し、片側p値を求める。この検定は、期待されるカウントが十分に大きい場合に有効だ。記事では、期待されるカウントが小さい場合には、正確検定を使用するべきだと指摘している。

また、Pearsonのカイ二乗検定も紹介されている。2x2の分割表においては、プールされたZ検定と数学的に同等だが、カイ二乗検定はより一般的な手法であり、r×cの分割表にも拡張できる。

記事の最後には、2x2の分割表に対する検定を選択するための実践的なチェックリストが示されている。まず、研究デザインを評価し、ランダム化された実験や小さな固定マージンテーブルでは、Fisherの正確検定を推奨している。サンプルサイズが大きい場合は、カイ二乗検定が適切であることが多い。次に、期待されるセルのカウントを確認する。いずれかの期待されるカウントが5未満の場合は、正確検定(Fisher検定またはBarnard検定)を使用する必要がある。すべての期待されるカウントが5以上の場合は、カイ二乗検定が有効だ。さらに、統計的検出力を考慮する。Barnard検定は、サンプルサイズが小さい場合にFisherの正確検定よりも高い検出力を提供することが多い。サンプルサイズが大きい場合、カイ二乗検定と正確検定の間の検出力の差は通常、無視できる。最後に、p値とともに効果量(リスク差、リスク比、またはオッズ比)を信頼区間とともに報告する必要がある。サンプルサイズが小さい場合は、より正確な信頼区間を得るためにNewcombeの方法を検討する。

この記事は、それぞれの検定の主要なアイデア、利点、制限事項、そして理想的な使用事例をまとめた表で締めくくられている。Fisherの正確検定は、サンプルサイズが小さいランダム化された試験に最適であり、Barnardの正確検定は、サンプルサイズが小さい観察研究に適している。プールされたZ検定は、サンプルサイズが大きい場合に高速に計算できるが、まれなイベントには不向きである。カイ二乗検定は、サンプルサイズが大きい調査やA/Bテストに有効だが、期待されるカウントが小さい場合には信頼性が低い。

関連コンテンツ

関連ITニュース