「サンプル数が少ないデータで、平均値の差をどう検証すればいいんだろう?」
こんな悩みを持ったことはありませんか?
データのサンプル数が少ないとき、正規分布をそのまま当てはめると誤差が大きくなります。
かといって統計の教科書を読み返すのも面倒ですよね。
そんなときに使うのがT.DIST関数です。
この記事では基本の書き方から実務での活用例まで解説します。
T.DIST.2T関数・T.DIST.RT関数との使い分けや、t検定との連携方法もあわせて整理しました。
T.DIST関数とは?t分布の確率を返す関数
T.DIST関数(読み方: ティー・ディスト)は、t分布に従うデータの確率を返す関数です。
「T」はt分布、「DIST」は「Distribution(分布)」の略です。
t分布とは、サンプル数が少なくて母集団の分散がわからないときに使う分布です。
釣り鐘型で正規分布によく似ていますが、裾が少し厚いのが特徴です。
自由度が大きくなるほど正規分布に近づきます。
T.DIST関数では、cumulative引数を切り替えることで次の2つの値を求められます。
- 累積分布関数(CDF): 「ある値以下になる確率」を返す。cumulative = TRUE
- 確率密度関数(PDF): 「ある値における確率密度」を返す。cumulative = FALSE
実務で使う場面のほとんどはCDF(累積分布関数)です。
t検定のp値を求めたり、信頼区間の片側確率を計算したりするときに活躍します。
T.DIST関数にできることをまとめると、次のとおりです。
- t統計量から左片側のp値(確率)を計算する
- 自由度を指定してt分布の理論的な確率を求める
- t分布の曲線グラフを描画する(PDF活用)
- NORM.DIST関数と組み合わせて確率の違いを比較する
NOTE
T.DIST関数はExcel 2010以降で使えます。
Microsoft 365、Excel 2013〜2024のすべてのバージョンに対応しています。
T.DIST関数の書き方(構文と引数)
基本構文
=T.DIST(x, 自由度, 関数形式)
カッコの中に、確率を求めたい値、自由度、出力の形式を指定します。
NORM.DIST関数と違って「平均」「標準偏差」の引数はありません。
t分布は平均0・分散が自由度で決まる分布だからです。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| x | 必須 | 確率を求めたい数値(t統計量に相当) |
| 自由度 | 必須 | t分布の自由度。1以上の整数を指定する |
| 関数形式 | 必須 | TRUEで累積分布関数(CDF)、FALSEで確率密度関数(PDF) |
3つの引数はすべて必須です。省略するとエラーになります。
TIP
自由度に小数を入れると、整数部分だけが使われます。
たとえば10.7と指定しても、内部では10として計算されます。
累積分布関数(CDF)と確率密度関数(PDF)の違い
ちょっとむずかしく見えますが、やっていることはシンプルです。
- CDF(TRUE): 「x以下になる確率」を返す。0〜1の値になる
- PDF(FALSE): 「xにおける確率密度」を返す。グラフ描画で使う
たとえば自由度10で x = 1.5 のとき、CDFは「1.5以下になる確率(約0.918)」を返し、
PDFは「x = 1.5 における曲線の高さ」を返します。
T.DIST関数の基本的な使い方
ここからは具体的なt統計量と自由度を使って、T.DIST関数の動きを確認していきましょう。
「t値以下になる確率」を求める(CDF)
自由度10の条件で、t統計量1.5以下になる確率を求めます。
=T.DIST(1.5, 10, TRUE)
結果は約 0.9178(91.78%)です。t値1.5以下になる確率は約92%ということになります。
=T.DIST(0, 10, TRUE)
結果は 0.5(50%)です。
t分布は平均0で左右対称なので、0以下になる確率はちょうど半分です。
=T.DIST(-1.5, 10, TRUE)
結果は約 0.0822(8.22%)です。
左右対称の性質から「1 – T.DIST(1.5, 10, TRUE)」と同じ値になります。
自由度を変えて確認する
同じx値(t値=2)で、自由度を変えるとどうなるか見てみましょう。
=T.DIST(2, 5, TRUE) → 約 0.9490
=T.DIST(2, 30, TRUE) → 約 0.9728
=T.DIST(2, 100, TRUE) → 約 0.9759
自由度が大きくなるほど、結果は標準正規分布の値(約0.9772)に近づいていきます。
サンプルサイズが大きいときはt分布と正規分布の差がほぼなくなる、という性質が確認できますね。
確率密度関数(PDF)の値を確認する
=T.DIST(0, 10, FALSE)
結果は約 0.3891 です。t分布カーブが平均0で最も高くなることを示しています。
=T.DIST(2, 10, FALSE)
結果は約 0.0610 です。t = 2 における曲線の高さです。
PDFの値そのものは「確率」ではないので、グラフ描画や曲線の比較に使います。
TIP
CDFの結果が0.5なら原点(t=0)と同じ位置、0.5より大きければ右側、小さければ左側です。
t分布が平均0で左右対称な性質を覚えておくと、結果を直感的に理解できますよ。
T.DIST関数の実践的な使い方・応用例
t検定のp値を求める(小サンプルの平均値検定)
新しい工程で作った製品16個の重さを測ったところ、平均100g、標本標準偏差8gでした。
「目標の95gより重くなっているか」を片側t検定で判定します。
まずt統計量を計算します。
=(100 - 95) / (8 / SQRT(16))
結果は 2.5 です。次にこのt値の右側確率(p値)を求めます。
=1 - T.DIST(2.5, 15, TRUE)
結果は約 0.0123(1.23%)です。
p値が0.05より小さいので、「平均が95gより大きい」と統計的に判断できます。
ここで自由度は「サンプルサイズ – 1 = 16 – 1 = 15」です。
同じ計算はT.DIST.RT関数でも一発で求められます。
自由度の決め方(n-1ルール)
自由度の決め方は検定の種類で変わります。実務でよく使うパターンをまとめました。
| 検定の種類 | 自由度の式 | 例 |
|---|---|---|
| 1標本t検定 | n – 1 | サンプル20個 → 自由度19 |
| 対応のある2標本t検定 | n – 1 | ペア15組 → 自由度14 |
| 等分散の2標本t検定 | n1 + n2 – 2 | 各群10個 → 自由度18 |
「n-1」は「データから平均を計算した時点で1つの自由度を使った」と理解すると覚えやすいです。
サンプルサイズから1を引くだけのケースが圧倒的に多いと考えてOKです。
t分布の曲線グラフを作成する(PDF活用)
PDFの値を使うと、t分布の釣り鐘型グラフを描けます。
A列に-4から4まで0.1刻みで値を入力し、B列に次の数式を入力します。
=T.DIST(A2, 10, FALSE)
B列のデータを散布図(または折れ線グラフ)にすると、自由度10のt分布カーブが描画されます。
C列に =T.DIST(A2, 5, FALSE) 、D列に =T.DIST(A2, 30, FALSE) を入れて並べると、
自由度の違いによるカーブの形の変化を比較できます。
プレゼン資料でt分布の特性を視覚化したいときに便利です。
TIP
よくあるエラーと対処法
#NUM!エラー
T.DIST関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| 自由度に1未満の値を指定した | 自由度は1以上の整数を指定する |
| 自由度にマイナスの値が入っている | セルの値を確認して正の値に修正する |
自由度は「サンプルサイズ – 1」など正の整数になるはずです。
0や負の値が入るのは式の組み立てミスです。
=T.DIST(1.5, 0, TRUE) → #NUM!エラー
=T.DIST(1.5, -5, TRUE) → #NUM!エラー
=T.DIST(1.5, 10, TRUE) → 正常(約0.9178)
#VALUE!エラー
引数に数値以外の文字列を指定すると発生します。
=T.DIST("abc", 10, TRUE) → #VALUE!エラー
セル参照を使う場合は、参照先に数値が入っているかを確認してください。
空白セルが混じっているとエラーになりやすいです。
#NAME?エラー
Excel 2007以前で T.DIST を使うと、ピリオド付きの関数名を認識できずに発生します。
=T.DIST(1.5, 10, TRUE) → #NAME?エラー(Excel 2007以前)
このときは旧 TDIST 関数を使うか、Excelを2010以降にアップデートしてください。
旧TDIST関数は仕様が異なるので、後述の比較表を参考にしてください。
TIP
「関数形式」の引数を忘れると引数不足でエラーになります。
CDFを求めるならTRUE、PDFを求めるならFALSEを必ず指定してください。
T.DIST.2T・T.DIST.RT・旧TDIST関数との違い・使い分け
3兄弟関数の使い分け早見表
t分布関連には3つの確率関数があります。
返す確率の範囲が違うので、検定の種類に合わせて選びます。
| 関数 | 返す確率 | cumulative引数 | 主な用途 | ||
|---|---|---|---|---|---|
| T.DIST | x以下になる確率(左片側) | あり(TRUE/FALSE) | 左側検定、PDF描画 | ||
| T.DIST.2T | t | より極端になる確率(両側) | なし | 両側t検定のp値 | |
| T.DIST.RT | x以上になる確率(右片側) | なし | 右側検定 |
T.DIST.2T と T.DIST.RT は cumulative 引数を持たず、常に確率を返します。=T.DIST.2T(2, 10, TRUE) のように書くとエラーになるので注意してください。
実務シナリオ別の使い分けは次のとおりです。
- 製品検査で「下限を下回る確率」を求めたい: T.DIST(左片側)
- 新製品が旧製品と「平均値が違う」かを検定したい: T.DIST.2T(両側)
- 改善後に「平均値が上がった」かを検定したい: T.DIST.RT(右片側)
旧TDIST関数との互換性
旧TDIST関数(Excel 2007以前)は新T.DIST関数とは仕様がかなり違います。
移行時には注意が必要です。
| 項目 | T.DIST(新) | TDIST(旧) |
|---|---|---|
| 引数 | (x, 自由度, 関数形式) | (x, 自由度, tails) |
| 返す確率 | 左片側 or PDF | 右片側 or 両側 |
| tails指定 | なし | tails=1で右側、tails=2で両側 |
| 導入バージョン | Excel 2010 | Excel 2003以前 |
旧TDIST関数の代替は次のとおりです。
| 旧書き方 | 新書き方 |
|---|---|
| =TDIST(x, df, 1) | =T.DIST.RT(x, df) |
| =TDIST(x, df, 2) | =T.DIST.2T(x, df) |
| (旧TDISTには相当なし) | =T.DIST(x, df, TRUE) |
旧TDIST関数で作られたブックは、計算結果を変えないかぎり書き換える必要はありません。
新規で数式を作るときはT.DIST関数群を使いましょう。
関連関数の一覧
| 関数 | 説明 |
|---|---|
| T.DIST | t分布の左片側確率または確率密度 |
| T.DIST.2T | t分布の両側確率 |
| T.DIST.RT | t分布の右片側確率 |
| T.INV | t分布の逆関数(確率→t値)。左片側 |
| T.INV.2T | t分布の逆関数。両側 |
| T.TEST | t検定のp値を直接計算 |
| TDIST | T.DISTの旧名(仕様は右側/両側) |
| NORM.DIST | 正規分布の確率(大サンプル向け) |
| STDEV.S | 標本標準偏差(t統計量の計算で使う) |
| AVERAGE | 標本平均(t統計量の計算で使う) |
まとめ
T.DIST関数は、t分布に従うデータの左片側確率または確率密度を返す関数です。
この記事のポイント
- 構文は
=T.DIST(x, 自由度, 関数形式)の3つの引数を指定する - 関数形式をTRUEにすると累積分布関数(CDF)、FALSEにすると確率密度関数(PDF)
- 実務ではCDF(TRUE)を使う場面が多い。「t値以下になる確率」が求まる
- 「t値以上の確率」は
=1 - T.DIST(...)またはT.DIST.RTで計算する - 自由度は「サンプルサイズ – 1」で求める(1標本t検定の場合)
- 両側検定には T.DIST.2T、右片側検定には T.DIST.RT を使う
- 旧TDIST関数は右側/両側を返すので、新T.DIST(左片側)と仕様が異なる点に注意
関連記事
T.DIST関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。
データ分析の幅が広がりますよ。
