「有意水準5%でカイ二乗検定の臨界値を出したいけど、1から引いて0.95に変換するのが面倒…」。そんな経験はありませんか?
CHISQ.INV関数だと確率を左側に変換する手間がかかりますよね。有意水準をそのまま渡せたら、もっとスムーズに検定できるのに、と感じる方も多いはずです。
そんなときに使えるのがCHISQ.INV.RT関数です。この記事ではGoogleスプレッドシートでのCHISQ.INV.RT関数の使い方を、基本構文から実務活用まで解説します。CHISQ.INVとの違いや、CHISQ.DIST.RTとの逆関数関係もあわせて紹介しますよ。
スプレッドシートのCHISQ.INV.RT関数とは
CHISQ.INV.RT関数(読み方: カイ・スクエア・インバース・ライトテール関数)は、カイ二乗分布の右側累積確率から対応する値(臨界値)を逆算する関数です。「CHISQ」は「Chi-Square(カイ二乗)」、「INV」は「Inverse(逆関数)」、「RT」は「Right-Tail(右側)」の略です。
CHISQ.DIST.RT関数が「カイ二乗値 → 右側確率」を求めるのに対し、CHISQ.INV.RT関数はその逆の「右側確率 → カイ二乗値」を求めます。つまり、2つの関数は逆関数の関係にあります。
CHISQ.INV.RT関数にできることをまとめると、次のとおりです。
- 有意水準(α)から適合度検定・独立性検定の臨界値を直接求める
- 「右側の確率がp以上になるカイ二乗値はいくつか」を逆算する
- 有意水準をそのまま渡せるので、検定の臨界値算出がシンプルになる
NOTE
CHISQ.INV.RT関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。
CHISQ.INV.RT関数の基本構文と引数
基本構文
=CHISQ.INV.RT(確率, 自由度)
カッコの中に2つの引数を指定します。
引数の一覧
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 確率(probability) | 必須 | 右側累積確率。0より大きく1未満の値を指定する |
| 自由度(degrees_freedom) | 必須 | 自由度。1以上の正の整数を指定する |
TIP
自由度(データから自由に値を決められる個数)は、検定の種類で決まります。適合度検定では「カテゴリ数 – 1」、独立性検定では「(行数 – 1) x (列数 – 1)」です。小数を渡した場合は整数部分だけが使われます。
戻り値とエラー
CHISQ.INV.RT関数は、指定した右側確率に対応するカイ二乗値を返します。
たとえば =CHISQ.INV.RT(0.05, 1) は約3.8415を返します。これは「自由度1のカイ二乗分布で、右側5%に対応する値」です。有意水準5%の臨界値としておなじみの数値ですね。
エラーになるケースは次のとおりです。
| 原因 | エラー | 例 |
|---|---|---|
| 確率が0以下または1以上 | #NUM! | =CHISQ.INV.RT(0, 3) |
| 自由度が1未満 | #NUM! | =CHISQ.INV.RT(0.05, 0) |
| 引数が数値でない | #VALUE! | =CHISQ.INV.RT("abc", 3) |
CHISQ.INV.RT関数の使い方(基本例)
まずはシンプルな例で動きを確認しましょう。有意水準5%(右側確率0.05)で、自由度を変えたときの臨界値を一覧にしてみます。
=CHISQ.INV.RT(0.05, 1) → 3.8415
=CHISQ.INV.RT(0.05, 3) → 7.8147
=CHISQ.INV.RT(0.05, 5) → 11.0705
=CHISQ.INV.RT(0.05, 10) → 18.3070
自由度が大きくなるほど、臨界値も大きくなっていくのがわかります。
有意水準を変えた場合の比較表も見てみましょう。自由度5で、有意水準を変えたときの結果です。
| 有意水準(右側確率) | CHISQ.INV.RT の結果 | 意味 |
|---|---|---|
| 0.10 | 9.2364 | 有意水準10%の臨界値 |
| 0.05 | 11.0705 | 有意水準5%の臨界値 |
| 0.01 | 15.0863 | 有意水準1%の臨界値 |
有意水準が小さいほど(判定を厳しくするほど)、臨界値は大きくなります。棄却に必要なカイ二乗値のハードルが上がるということですね。
CHISQ.INV.RT関数のメリットは、有意水準の値をそのまま第1引数に渡せるところです。0.05と入力すれば有意水準5%の臨界値が出るので、「1 – 0.05 = 0.95」の変換が不要ですよ。
CHISQ.DIST.RTとの逆関数関係を確認する
CHISQ.INV.RT関数とCHISQ.DIST.RT関数は逆関数の関係にあります。次の数式で確認できますよ。
=CHISQ.DIST.RT(CHISQ.INV.RT(0.05, 3), 3)
結果は0.05です。CHISQ.INV.RTで求めた値をCHISQ.DIST.RTに戻すと、元の確率に戻ります。「右側確率 → カイ二乗値 → 右側確率」のラウンドトリップが成立するわけですね。
CHISQ.INV.RT関数の実務活用パターン
CHISQ.INV.RT関数の基本がわかったところで、実務で使えるパターンを紹介します。
適合度検定の臨界値を求める
「アンケートの5択に偏りがあるか」を判定するとき、有意水準から臨界値を求めてみましょう。
たとえば、5択アンケート(回答合計100)の結果が次のとおりだったとします。
| 選択肢 | 観測度数 | 期待度数(均等なら) |
|---|---|---|
| A | 28 | 20 |
| B | 15 | 20 |
| C | 22 | 20 |
| D | 18 | 20 |
| E | 17 | 20 |
まずカイ二乗統計量(観測データと期待値のズレの大きさ)を計算します。
=(28-20)^2/20 + (15-20)^2/20 + (22-20)^2/20 + (18-20)^2/20 + (17-20)^2/20
結果は5.3です。自由度は「カテゴリ数 – 1 = 4」です。
次に有意水準5%の臨界値をCHISQ.INV.RT関数で求めます。
=CHISQ.INV.RT(0.05, 4)
結果は約9.4877です。有意水準の0.05をそのまま渡すだけで臨界値が出ます。
カイ二乗統計量(5.3)が臨界値(9.4877)より小さいので、「回答に有意な偏りがあるとはいえない」と判断できます。CHISQ.INV関数のように0.95に変換する必要がないのがCHISQ.INV.RTの便利なところですよ。
TIP
p値で判定する方法もあります。CHISQ.DIST.RT関数で
=CHISQ.DIST.RT(5.3, 4)と書けば、p値(約0.2578)を直接求められます。p値が0.05より大きければ「偏りなし」です。
独立性検定の判定基準を設定する
「性別と商品の好みに関連があるか」を調べる独立性検定でも、臨界値を活用できます。
次のクロス集計表を例にします。
| 商品A | 商品B | 合計 | |
|---|---|---|---|
| 男性 | 30 | 20 | 50 |
| 女性 | 15 | 35 | 50 |
| 合計 | 45 | 55 | 100 |
カイ二乗統計量を計算すると約9.0909です。自由度は (2-1) x (2-1) = 1 です。
=CHISQ.INV.RT(0.05, 1)
結果は約3.8415です。
カイ二乗統計量(9.0909)が臨界値(3.8415)を大きく上回っているので、「性別と商品の好みには関連がある」と判断できますね。
有意水準を1%に厳しくしても確認してみましょう。
=CHISQ.INV.RT(0.01, 1)
結果は約6.6349です。カイ二乗統計量(9.0909)はこの臨界値も上回っているので、1%水準でも有意と判断できます。このように有意水準を変えて段階的に確認する場面でも、CHISQ.INV.RT関数なら数値を差し替えるだけで済みますよ。
CHISQ.INV.RTとCHISQ.INVの違い
カイ二乗分布の逆関数には、CHISQ.INV.RTとCHISQ.INVの2種類があります。違いを整理しましょう。
| 比較項目 | CHISQ.INV.RT | CHISQ.INV |
|---|---|---|
| 確率の基準 | 右側累積確率 | 左側累積確率 |
| 有意水準5%のとき | 0.05を渡す | 0.95を渡す |
| 結果 | 同じ臨界値が返る | 同じ臨界値が返る |
| 向いている場面 | 検定の臨界値を求める | 累積確率テーブルの作成 |
次の2つの数式は同じ結果を返します。
=CHISQ.INV.RT(0.05, 4) → 9.4877
=CHISQ.INV(0.95, 4) → 9.4877
CHISQ.INV.RTは「右側の確率」を渡すので0.05を指定します。CHISQ.INV関数は「左側の確率」を渡すので0.95を指定します。数学的には次の関係が成り立ちます。
CHISQ.INV.RT(α, df) = CHISQ.INV(1 - α, df)
使い分けのポイントは次のとおりです。
- 有意水準(α)から臨界値を求めたい → CHISQ.INV.RTが直感的(αをそのまま渡せる)
- 累積確率テーブルを作りたい → CHISQ.INVが便利(0.1, 0.5, 0.9… と並べられる)
- 他の逆関数と揃えたい → NORM.INV関数やT.INV関数は左側確率を基準にしているため、統一したいならCHISQ.INVを選ぶ
どちらを使っても結果は同じなので、場面に合うほうを選んでみてくださいね。
CHISQ.INV.RT関数でよくあるエラーと対処法
CHISQ.INV.RT関数でつまずきやすいポイントをまとめました。
確率に0または1を指定して#NUM!エラー
確率は0より大きく1より小さい値(0 < p < 1)で指定します。0や1を渡すと#NUM!エラーです。
=CHISQ.INV.RT(0, 3) ← #NUM! エラー
=CHISQ.INV.RT(1, 3) ← #NUM! エラー
「ちょうど0%」や「ちょうど100%」に対応するカイ二乗値は定義できないためです。0.001や0.999のように、0と1を避けた値を指定しましょう。
自由度に0を指定して#NUM!エラー
自由度は1以上の正の整数でなければなりません。0を指定すると#NUM!エラーになります。
=CHISQ.INV.RT(0.05, 0) ← #NUM! エラー
カテゴリ数が1つしかない場合(自由度0)はそもそも検定が成立しません。データの構造を見直してみてくださいね。
引数に文字列を渡して#VALUE!エラー
数値であるべき引数にテキストが入ると#VALUE!エラーです。セル参照を使う場合は、参照先が数値であることを確認しましょう。
=CHISQ.INV.RT("abc", 3) ← #VALUE! エラー
CHISQ.INV.RTとCHISQ.INVを混同して結果が逆になる
有意水準5%の臨界値を求めるとき、CHISQ.INV.RTには0.05を、CHISQ.INVには0.95を渡します。間違えると結果が大きく変わります。
=CHISQ.INV.RT(0.95, 4) → 0.7107(右側95%の値。検定には使えない)
=CHISQ.INV.RT(0.05, 4) → 9.4877(これが正しい臨界値)
「CHISQ.INV.RTには有意水準をそのまま渡す」と覚えておけば、混同を防げますよ。
まとめ
CHISQ.INV.RT関数は、カイ二乗分布の右側累積確率から対応するカイ二乗値(臨界値)を逆算する関数です。
- 引数は「確率」と「自由度」の2つだけ。有意水準をそのまま渡して臨界値を求められる
- 適合度検定や独立性検定で、有意水準から判定基準を直接算出するのに便利
- CHISQ.INV関数は左側確率を基準にする関数。CHISQ.INV.RT(α, df) = CHISQ.INV(1-α, df) の関係がある
- CHISQ.DIST.RT関数とは逆関数の関係にある
- 確率に0や1を渡すと
#NUM!エラー。0より大きく1未満の値を指定する - 関連関数として、NORM.INV関数(正規分布の逆関数)やT.INV関数(t分布の逆関数)もある
「1 – α」の変換が不要なのがCHISQ.INV.RT関数の最大のメリットです。カイ二乗検定の臨界値を手軽に求めたいときに、ぜひ活用してみてくださいね。
