「カイ二乗検定をやりたいけど、p値ってExcelでどうやって出すんだろう?」
こんな悩みを持ったことはありませんか?
クロス集計表を作って観測値と期待値からカイ二乗統計量まで計算したものの、最後のp値だけ手元に出てこない。
標準正規分布表のように紙の付表をめくるのも今どき大変ですよね。
そんなときに使うのがCHISQ.DIST.RT関数です。
カイ二乗値と自由度を渡すだけで、検定で必要な右側確率(p値)が一発で求まります。
この記事では基本の書き方から、適合度検定や独立性検定での実例、CHISQ.DIST関数や旧CHIDIST関数との使い分けまで解説します。
CHISQ.DIST.RT関数とは?カイ二乗分布の右側確率を返す関数
CHISQ.DIST.RT関数(読み方: カイ・スクエア・ディスト・アール・ティー)は、カイ二乗(χ²)分布の右側確率を返す関数です。
「CHI」は「Chi(カイ)」、「SQ」は「Square(二乗)」、「DIST」は「Distribution(分布)」、末尾の「RT」は「Right Tail(右側の裾)」の略です。
カイ二乗検定では「観測値と期待値のズレが大きいほど検定統計量が大きくなる」という性質があります。
そのため「Xが大きい=偶然ではめったに起こらない」という方向で判断するので、p値は分布の 右側(上側) で評価します。
CHISQ.DIST.RT関数はこの「右側確率=p値」をダイレクトに返してくれる、検定実務向けの関数です。
CHISQ.DIST関数が左側累積確率と確率密度を返す汎用関数なのに対し、CHISQ.DIST.RT関数は「p値専用」と割り切った設計です。
そのため引数も少なく、検定だけが目的なら断然こちらが使いやすいですよ。
CHISQ.DIST.RT関数にできることをまとめると、次のとおりです。
- カイ二乗検定のp値を一発で求める
- 適合度検定(アンケートなど1変数の偏り判定)のp値計算
- 独立性検定(クロス集計の関連性判定)のp値計算
- 等質性検定(複数集団の分布比較)のp値計算
- 旧CHIDIST関数のかんたんな置き換え
NOTE
CHISQ.DIST.RT関数はExcel 2010以降で使えます。
Microsoft 365、Excel 2013〜2024のすべてのバージョンに対応しています。
Excel 2007以前では旧CHIDIST関数(同じく右側確率を返す)を使ってください。
CHISQ.DIST.RT関数の書き方(構文と引数)
基本構文
=CHISQ.DIST.RT(x, 自由度)
カッコの中に、評価したいカイ二乗値と自由度を指定します。
CHISQ.DIST関数とは違って、関数形式(cumulative)の引数は不要です。
常に右側確率を返すと決まっているので、引数が2つで済むのが特徴ですね。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| x | 必須 | カイ二乗値(検定統計量)。0以上の値を指定する |
| 自由度 | 必須 | カイ二乗分布の自由度。1以上の整数を指定する |
引数2つはどちらも必須です。省略するとエラーになります。
TIP
自由度に小数を入れると、整数部分だけが使われます。
たとえば3.7と指定しても、内部では3として計算されます。
「右側確率」とは何か(左側との違い)
ちょっとややこしく見えますが、考え方はシンプルです。
- 右側確率: 「x以上になる確率」を返す。CHISQ.DIST.RTが返す値
- 左側確率: 「x以下になる確率」を返す。CHISQ.DIST(x, df, TRUE)が返す値
両者を足すとちょうど1になります。
たとえば自由度3で x = 2 の場合、左側は約0.4276、右側は約0.5724で、合計1.0です。
=CHISQ.DIST(2, 3, TRUE) → 約 0.4276(左側)
=CHISQ.DIST.RT(2, 3) → 約 0.5724(右側)
カイ二乗検定では「観測したXと同じか、それより極端な値が偶然で起こる確率」を見たいので、右側確率を使います。
だからCHISQ.DIST.RTは検定のp値そのものになるんですね。
TIP
=1 - CHISQ.DIST(x, df, TRUE)と書いても同じ結果が得られます。
ただ、CHISQ.DIST.RT を使ったほうが意図が明確で、引数も少なくて済みますよ。
CHISQ.DIST.RT関数の基本的な使い方
ここからは具体的なカイ二乗値と自由度を使って、CHISQ.DIST.RT関数の動きを確認していきましょう。
「カイ二乗値以上になる確率」を求める
自由度1のカイ二乗分布で、3.84以上になる確率を求めます。
=CHISQ.DIST.RT(3.84, 1)
結果は約 0.0500(5.00%)です。
カイ二乗値が3.84以上に出る確率は約5%ということになります。
この3.84は自由度1・有意水準5%の右側臨界値として有名な値です。
CHISQ.DIST.RTの結果がぴったり0.05になることが確認できますね。
別のカイ二乗値も試してみましょう。
=CHISQ.DIST.RT(2, 3)
結果は約 0.5724(57.24%)です。
自由度3で2以上になる確率は半分以上、というイメージですね。
=CHISQ.DIST.RT(0, 3)
結果は 1(100%)です。
カイ二乗分布は0以上の値しか取らないので、「0以上になる確率」は必ず100%になります。
自由度を変えて確認する
同じカイ二乗値(x=5)で、自由度を変えるとどうなるか見てみましょう。
=CHISQ.DIST.RT(5, 2) → 約 0.0821
=CHISQ.DIST.RT(5, 3) → 約 0.1718
=CHISQ.DIST.RT(5, 5) → 約 0.4159
=CHISQ.DIST.RT(5, 10) → 約 0.8912
自由度が大きくなるほど、カイ二乗分布のピークは右にずれていきます。
そのため同じx=5でも、自由度が大きいほうが「5以上になる確率」が大きくなる関係になります。
CHISQ.DISTとCHISQ.DIST.RTを並べて比較する
自由度3のカイ二乗分布で、xを変えたときの結果を並べてみました。
| x | CHISQ.DIST(TRUE)(左側) | CHISQ.DIST.RT(右側) | 合計 |
|---|---|---|---|
| 1 | 0.1987 | 0.8013 | 1.0000 |
| 2 | 0.4276 | 0.5724 | 1.0000 |
| 3 | 0.6084 | 0.3916 | 1.0000 |
| 5 | 0.8282 | 0.1718 | 1.0000 |
| 7.815 | 0.9500 | 0.0500 | 1.0000 |
左側と右側を足すと必ず1になることが確認できますね。
xが大きくなるほど右側確率は小さくなり、p値が小さい=有意になる、という構造になっています。
TIP
「CHISQ.DIST.RT < 有意水準(0.05など)」なら帰無仮説を棄却できます。
CHISQ.DIST.RTの結果はp値そのものなので、判定ルールがそのまま使えます。
検定の流れに自然に乗りやすいですよ。
CHISQ.DIST.RT関数の実践的な使い方・応用例
適合度検定で5択アンケートのp値を求める
「5つの選択肢に均等に回答が分かれているか」を統計的に判定するのが適合度検定です。
CHISQ.DIST.RT関数を使えば、カイ二乗値からp値を一発で求められます。
たとえば5択アンケート(回答数合計100)の結果が次のとおりだったとします。
| 選択肢 | 観測度数 | 期待度数(均等なら) |
|---|---|---|
| A | 28 | 20 |
| B | 15 | 20 |
| C | 22 | 20 |
| D | 18 | 20 |
| E | 17 | 20 |
まずカイ二乗統計量を求めます。
各カテゴリの「(観測値 – 期待値)² / 期待値」を合計する計算です。
=(28-20)^2/20 + (15-20)^2/20 + (22-20)^2/20 + (18-20)^2/20 + (17-20)^2/20
結果は 5.3 です。自由度は「カテゴリ数 – 1 = 4」になります。
次にp値を求めます。
=CHISQ.DIST.RT(5.3, 4)
結果は約 0.2578(25.78%)です。
有意水準5%(0.05)よりはるかに大きいので、「回答に有意な偏りがあるとはいえない」と判断できます。
TIP
観測値と期待値の範囲があるなら
=SUMPRODUCT((A1:A5-B1:B5)^2/B1:B5)の1式でカイ二乗統計量がまとめて計算できます。
その結果をそのままCHISQ.DIST.RTに渡せば、p値計算が2ステップで完了しますよ。
独立性検定で2×2クロス集計のp値を求める
「性別と商品の好みに関連はあるか」のように、2つのカテゴリ変数の関連を調べるのが独立性検定です。
たとえば、次のクロス集計表があるとします。
| 商品A | 商品B | 合計 | |
|---|---|---|---|
| 男性 | 30 | 20 | 50 |
| 女性 | 15 | 35 | 50 |
| 合計 | 45 | 55 | 100 |
期待度数は「行合計 × 列合計 ÷ 総合計」で求めます。
たとえば男性×商品Aの期待度数は 50 × 45 ÷ 100 = 22.5 です。
同様に計算すると、4セルの期待度数は 22.5 / 27.5 / 22.5 / 27.5 になります。
カイ二乗統計量を計算します。
=(30-22.5)^2/22.5 + (20-27.5)^2/27.5 + (15-22.5)^2/22.5 + (35-27.5)^2/27.5
結果は約 9.0909 です。自由度は (2-1) × (2-1) = 1 です。
=CHISQ.DIST.RT(9.0909, 1)
結果は約 0.0026(0.26%)です。
有意水準5%を大きく下回るので、「性別と商品の好みには有意な関連がある」と判断できますね。
製造ラインの不良品分布が均一か確認する
品質管理の現場でも、CHISQ.DIST.RT関数は活躍します。
月〜金の不良品数が {8, 12, 6, 14, 10} で、本来は均等に各10個ずつ発生する想定だったとします。
=(8-10)^2/10 + (12-10)^2/10 + (6-10)^2/10 + (14-10)^2/10 + (10-10)^2/10
結果は 4.0 です。自由度は 5-1 = 4 です。
=CHISQ.DIST.RT(4.0, 4)
結果は約 0.4060(40.60%)です。
有意水準5%よりずっと大きいので、「曜日による偏りがあるとはいえない」と結論できます。
特定の曜日に不良品が集中しているわけではなさそうですね。
自由度の決め方早見表
実務でカイ二乗検定を使うとき、自由度の決め方は次のように整理できます。
| 検定の種類 | 自由度の式 | 例 |
|---|---|---|
| 適合度検定 | カテゴリ数 – 1 | 5択アンケート → 4 |
| 独立性検定(クロス集計) | (行数 – 1) × (列数 – 1) | 2×2 → 1、3×4 → 6 |
| 等質性検定 | (行数 – 1) × (列数 – 1) | 独立性検定と同じ |
| 分散の検定(1標本) | n – 1 | n=20 → 19 |
TIP
適合度検定や独立性検定では、すべてのセルの期待度数が5以上あることが前提です。
5未満のセルがある場合はカテゴリを統合するか、フィッシャーの正確検定への切り替えを検討してくださいね。
よくあるエラーと対処法
#NUM!エラー
CHISQ.DIST.RT関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| xに負の値を指定した | カイ二乗分布は0以上のみ。xに正の値を指定する |
| 自由度が1未満 | 自由度は1以上の整数を指定する |
| 自由度が0または負の値 | セルの式を見直して、正の値が入るように修正する |
カイ二乗分布が0以上の値しか取らないことと、自由度が1以上であることを覚えておけば対処は簡単です。
=CHISQ.DIST.RT(-1, 3) → #NUM!エラー
=CHISQ.DIST.RT(2, 0) → #NUM!エラー
=CHISQ.DIST.RT(2, 3) → 正常(約0.5724)
#VALUE!エラー
引数に数値以外の文字列を指定すると発生します。
=CHISQ.DIST.RT("abc", 3) → #VALUE!エラー
セル参照を使う場合は、参照先に数値が入っているかを確認してください。
空白セルが文字列扱いになっている場合もエラーが出やすいです。
#NAME?エラー
Excel 2007以前で CHISQ.DIST.RT を使うと、ピリオド付きの関数名を認識できずに発生します。
=CHISQ.DIST.RT(2, 3) → #NAME?エラー(Excel 2007以前)
このときは旧 CHIDIST 関数を使うか、Excelを2010以降にアップデートしてください。
旧CHIDIST関数も同じ右側確率を返す仕様なので、CHISQ.DIST.RTと同じ感覚で使えます。
なお、関数名の「.(ピリオド)」を全角で入力した場合も#NAME?エラーになります。
半角ピリオドで入力されているかも合わせて確認してください。
TIP
CHISQ.DIST.RT は引数が「x, 自由度」の2つだけです。
CHISQ.DIST と混同して関数形式(TRUE/FALSE)を渡すと引数オーバーになるので注意してください。
CHISQ.DIST・CHISQ.INV.RT・CHISQ.TEST・旧CHIDIST関数との違い・使い分け
カイ二乗分布関連関数の使い分け早見表
カイ二乗分布関連には、用途の違う関数がいくつかあります。
求めたい値や検定の種類に合わせて選びます。
| 関数 | 返す値 | 引数の数 | 主な用途 |
|---|---|---|---|
| CHISQ.DIST.RT | x以上になる確率(右側) | 2 | 検定のp値計算 |
| CHISQ.DIST | x以下になる累積確率 または PDF | 3 | 左側確率・分布のグラフ描画 |
| CHISQ.INV.RT | 確率 → x(右側の逆関数) | 2 | 有意水準から臨界値を直接求める |
| CHISQ.INV | 累積確率 → x(左側の逆関数) | 2 | 左側臨界値の算出 |
| CHISQ.TEST | データ範囲から直接カイ二乗検定のp値 | 2(範囲) | 観測値・期待値の配列から一発で計算 |
実務シナリオ別の使い分けは次のとおりです。
- 手元のカイ二乗値からp値を求めたい: CHISQ.DIST.RT
- 観測値・期待値の範囲から直接p値を出したい: CHISQ.TEST
- 有意水準から臨界値を逆算したい: CHISQ.INV.RT(例: 自由度4・5%水準なら約9.49)
- カイ二乗分布のカーブをグラフにしたい: CHISQ.DIST(x, df, FALSE)
TIP
CHISQ.TEST関数を使うと観測値と期待値の範囲を渡すだけでp値が出るので、最も手早いです。
ただ「カイ二乗値そのものも結果に残したい」「途中計算を見せたい」場面ではCHISQ.DIST.RTが便利ですよ。
旧CHIDIST関数からの完全代替
旧CHIDIST関数(Excel 2007以前)は、CHISQ.DIST.RTとまったく同じ右側確率を返す関数です。
引数も戻り値も完全に同じなので、置き換えはとてもシンプルです。
| 旧書き方 | 新書き方 |
|---|---|
| =CHIDIST(x, df) | =CHISQ.DIST.RT(x, df) |
| =CHIINV(p, df) | =CHISQ.INV.RT(p, df) |
| =CHITEST(actual, expected) | =CHISQ.TEST(actual, expected) |
旧CHIDIST関数で作られたブックは、計算結果を変えないかぎり書き換える必要はありません。
新規で数式を作るときはCHISQ.DIST.RT関数を使いましょう。
TIP
旧CHIDISTは「右側」、新CHISQ.DIST(TRUE)は「左側」と意味が逆になります。
旧→新の置き換えで CHIDIST → CHISQ.DIST と書いてしまうと結果がひっくり返ります。
正しい後継はCHISQ.DIST.RTなので、混同しないようにしてください。
関連関数の一覧
| 関数 | 説明 |
|---|---|
| CHISQ.DIST.RT | カイ二乗分布の右側累積確率 |
| CHISQ.DIST | カイ二乗分布の左側累積確率または確率密度 |
| CHISQ.INV | カイ二乗分布の逆関数(確率→x)。左側 |
| CHISQ.INV.RT | カイ二乗分布の逆関数。右側 |
| CHISQ.TEST | データ範囲から直接カイ二乗検定のp値 |
| CHIDIST | CHISQ.DIST.RTの旧名(右側確率のみ) |
| T.DIST | t分布の左側確率(少サンプルの平均差検定) |
| F.DIST | F分布の左側確率(分散比の検定) |
| T.TEST | t検定のp値を直接計算 |
| F.TEST | F検定のp値を直接計算 |
| VAR.S | 標本分散 |
| STDEV.S | 標本標準偏差 |
| AVERAGE | 標本平均 |
まとめ
CHISQ.DIST.RT関数は、カイ二乗(χ²)分布にもとづく右側確率を返す関数です。
カイ二乗検定のp値を一発で求められる、検定実務向けのシンプルな関数です。
この記事のポイント
- 構文は
=CHISQ.DIST.RT(x, 自由度)の2つの引数を指定する - 関数形式(cumulative)の引数は不要。常に右側確率(p値そのもの)を返す
- カイ二乗検定では「Xが大きい=偶然では起こりにくい」ので、p値は右側確率を使う
=CHISQ.DIST.RT(x, df) = 1 - CHISQ.DIST(x, df, TRUE)の関係- 自由度は適合度検定なら「カテゴリ数 – 1」、独立性検定なら「(行 – 1) × (列 – 1)」
- 適合度検定・独立性検定・品質管理の偏り判定で活躍する
- 期待度数が5未満のセルがあると検定の精度が落ちるため、カテゴリ統合や別検定への切り替えを検討する
- 旧CHIDIST関数の正しい後継はCHISQ.DIST(左側)ではなくCHISQ.DIST.RT(右側)
CHISQ.DIST.RT関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。
データ分析の幅が広がりますよ。
