「アンケートで平均は3.8点だったけど、母集団の平均はどのあたりにあると言えるのか?」そんな場面で活躍するのがCONFIDENCE.T関数です。この関数はt分布を使って、標本データから母平均の信頼区間を推定します。母標準偏差が不明な実務データに使える点が特徴です。兄弟関数であるCONFIDENCE.NORMとの違いも含めて、この記事で整理していきます。
CONFIDENCE.T関数とは?(母標準偏差が不明なときの信頼区間)
CONFIDENCE.T関数は、スチューデントのt分布を使って母集団の平均に対する信頼区間の半幅を返す統計関数です。標本平均にこの値を加減すれば、母平均が含まれると考えられる範囲を導き出せます。
実務で扱うデータのほとんどは、母集団の標準偏差(σ)が事前にわかっていません。アンケート回答も品質検査の測定値も、標本から推測するしかない値です。こうした「母σ不明」の場面に適したのがCONFIDENCE.Tです。
信頼区間とは何か(平均値だけでは伝わらない理由)
信頼区間とは、母集団の真の値が含まれると推定される範囲のことです。標本平均が3.8点でも、「母集団の平均もピッタリ3.8点」とは限りません。サンプルが変われば平均も揺れます。「この範囲に母平均が含まれる」という幅のある表現のほうが、実態に近い情報を伝えられます。
95%信頼区間は、「同じ手順でサンプリングと計算を繰り返したとき、95%の確率で母平均を含む範囲」という意味です。個別の区間について「95%の確率で母平均がここにある」と解釈するのは、厳密には誤りなので注意してください。
CONFIDENCE.Tが必要になる場面
次のような業務データは、CONFIDENCE.Tの出番です。
- 顧客満足度アンケート(n=10〜30程度)の平均スコア区間推定
- 品質検査で寸法や重量を少数サンプル測定したときの平均推定
- 営業担当者別の成約率など、標本データから母集団の傾向を推測したい場面
いずれも「母σが不明」「標本サイズが小さい」という条件を満たします。正規分布を前提とするCONFIDENCE.NORMより、t分布ベースのCONFIDENCE.Tのほうが安全です。
構文と引数(alpha / standard_dev / size)
CONFIDENCE.Tは3つの引数を取ります。すべて必須項目です。
=CONFIDENCE.T(alpha, standard_dev, size)
各引数の意味と入力ルール
| 引数 | 必須 | 説明 |
|---|---|---|
| alpha | 必須 | 有意水準。0より大きく1より小さい値。信頼度 = 100×(1-alpha)% |
| standard_dev | 必須 | 標本の標準偏差。通常はSTDEV.Sの結果を代入。0より大きい値 |
| size | 必須 | 標本サイズ。1以上の整数(小数は切り捨て) |
Microsoft公式ではstandard_devを「母集団の標準偏差」と記載しています。ただしCONFIDENCE.Tの実際の用途は「母σが未知のときに標本標準偏差で代用する」ものです。実務ではSTDEV.Sで求めた値を素直に代入して構いません。
95%信頼区間を求めるときのalpha値
信頼度とalphaは「信頼度 + alpha = 1」の関係です。よく使う組み合わせは以下のとおりです。
| 信頼度 | alpha |
|---|---|
| 90% | 0.1 |
| 95% | 0.05 |
| 99% | 0.01 |
ビジネス実務で最も使われるのは95%信頼区間(alpha=0.05)です。まずはこの値を覚えておけば十分でしょう。
基本の使い方(標本データから95%信頼区間を求める)
Microsoftの公式例で動作を確認します。alpha=0.05、standard_dev=1、size=50のケースです。
=CONFIDENCE.T(0.05, 1, 50)
結果は約 0.284196855 となります。標本平均が10.00だった場合、母平均は「10.00 ± 0.284」、つまり 9.716〜10.284 の範囲に95%の信頼度で含まれると推定できます。
信頼区間の上下限を求めるセット数式(AVERAGE ± CONFIDENCE.T)
信頼区間の計算は、標本平均を中心に半幅を加減する形で表現できます。
x̄ ± CONFIDENCE.T(alpha, s, n)
Excel上では、AVERAGE関数とSTDEV.S関数をCONFIDENCE.Tと組み合わせるのが定番です。
上限: =AVERAGE(A2:A16) + CONFIDENCE.T(0.05, STDEV.S(A2:A16), COUNT(A2:A16))
下限: =AVERAGE(A2:A16) - CONFIDENCE.T(0.05, STDEV.S(A2:A16), COUNT(A2:A16))
COUNT関数で標本サイズを自動取得すれば、データ範囲を変えても数式を書き換える必要がありません。
実際のセル入力例
A2:A16にアンケートスコア(15件)が入力されている前提で、信頼区間を求める数式は次のとおりです。
B1: =AVERAGE(A2:A16) 標本平均
B2: =STDEV.S(A2:A16) 標本標準偏差
B3: =COUNT(A2:A16) 標本サイズ
B4: =CONFIDENCE.T(0.05, B2, B3) 信頼区間の半幅
B5: =B1 - B4 下限
B6: =B1 + B4 上限
一度このテンプレを作っておけば、別データにも流用できます。
CONFIDENCE.NORMとの違いと使い分け(判断フロー付き)
CONFIDENCE.Tと対をなす関数がCONFIDENCE.NORM関数です。どちらを使うべきか迷うケースは多いので、ここで判断軸を明確にしておきましょう。
3つのCONFIDENCE系関数の位置づけ
Excelには信頼区間を求める関数が3つあります。
| 関数 | 分布 | 前提 | 利用シーン |
|---|---|---|---|
| CONFIDENCE | 正規分布 | 母σ既知(互換用) | Excel 2007以前との互換。新規はNORM/T推奨 |
| CONFIDENCE.NORM | 正規分布 | 母σ既知 | 工程管理で母σが確定している場面 |
| CONFIDENCE.T | t分布 | 母σ不明 | 標本から推定する一般的な実務データ |
使い分け判断フロー(母σ既知か?)
判断は次のフローで進めます。
母集団の標準偏差(σ)は既知か?
├─ YES → CONFIDENCE.NORM(正規分布で計算)
└─ NO → CONFIDENCE.T(t分布で計算)
└─ 実務データはほぼこちら
「母σが既知」とは、過去の長期実績や工程管理標準値など、標本以外の情報源から母標準偏差が確定している場合を指します。それ以外、つまり標本から推測するしかない場面ではCONFIDENCE.Tが正解です。
n≧30のようにサンプルが十分大きい場合でも、母σが不明ならCONFIDENCE.Tで問題ありません。nが大きいときはt分布が正規分布に収束するため、両関数の結果はほぼ一致します。迷ったらCONFIDENCE.Tを選ぶのが安全策です。
同一データで両関数の結果を比較(標本サイズが小さいほどTの区間が広い)
同じstandard_dev=5でサンプルサイズを変えたときの両関数の値です(alpha=0.05)。
| 標本サイズ(n) | CONFIDENCE.T | CONFIDENCE.NORM | 差 |
|---|---|---|---|
| 5 | 約 6.205 | 約 4.382 | +1.823 |
| 10 | 約 3.573 | 約 3.099 | +0.474 |
| 20 | 約 2.342 | 約 2.191 | +0.151 |
| 30 | 約 1.868 | 約 1.789 | +0.079 |
| 50 | 約 1.423 | 約 1.386 | +0.037 |
| 100 | 約 0.985 | 約 0.980 | +0.005 |
nが小さいほどCONFIDENCE.Tの値が大きく、区間が広がる様子がはっきり出ています。標本が少ないほど推定の不確実性が高まり、t分布がその補正を加えるためです。n=100前後になると両者の差は0.01以下となり、実質的に同じ結果になります。
実務活用例
数値の意味が掴みづらいので、現場に近いシナリオで具体的に使ってみましょう。
アンケートスコア(n=15)の平均に対する95%信頼区間
顧客満足度アンケート15件の回答(5点満点)から、母集団全体の平均スコアを推定するケースです。
標本平均(AVERAGE): 3.8点
標本標準偏差(STDEV.S): 0.72
標本サイズ: 15
有意水準: 0.05(95%信頼区間)
=CONFIDENCE.T(0.05, 0.72, 15) → 約 0.399
結果は約0.399ですので、母平均スコアは 3.401〜4.199点 の範囲にあると95%の信頼度で推定できます。「3.8点」という1つの数値だけを報告するより、「3.4〜4.2点の範囲にある」と幅付きで示したほうが、意思決定者にとって誤解の少ない情報になります。
比較として、同じ条件でCONFIDENCE.NORMを使うと結果は約0.364です。CONFIDENCE.Tのほうが区間を広めに見積もる分、少数サンプル時のリスクを織り込んでいるとわかります。
品質検査の寸法測定(n=10)の信頼区間
製造ロットから10個サンプリングし、寸法(mm)を測定して平均寸法を区間推定するケースです。
標本平均(AVERAGE): 50.3 mm
標本標準偏差(STDEV.S): 0.15
標本サイズ: 10
有意水準: 0.05(95%信頼区間)
=CONFIDENCE.T(0.05, 0.15, 10) → 約 0.107
結果は約0.107です。ロット全体の平均寸法は 50.193〜50.407mm の範囲にあると推定できます。規格の公差範囲と比較すれば、「ロット全体が仕様を満たす可能性が高いか」という判断に使えます。
n=10と標本サイズが小さいケースは、CONFIDENCE.Tの真価が出る場面です。母σがわからない以上、t分布ベースで保守的に区間を広めに取るのが統計的に正しい姿勢です。
エラーと対処法(#NUM! / #VALUE!)
引数の指定を誤ると、CONFIDENCE.Tは以下のエラーを返します。
#NUM!エラーの原因一覧(alpha範囲外・standard_dev≦0・size
| エラー | 発生条件 | 対処法 |
|---|---|---|
| #NUM! | alpha ≤ 0 または alpha ≥ 1 | 0より大きく1未満の値を指定(例: 0.05) |
| #NUM! | standard_dev ≦ 0 | 標準偏差は正の値。STDEV.Sの結果が0になっていないか確認 |
| #NUM! | size < 1 | 標本サイズは1以上の整数を指定 |
| #DIV/0! | size = 1 | 自由度が0になり計算不能。最低でもn≧2が必要 |
| #VALUE! | 引数に数値以外 | セル参照先が文字列や空白になっていないか確認 |
よくあるのは、alphaに「95」と入力して#NUM!になるケースです。引数は有意水準(1-信頼度)なので、95%信頼区間なら0.05が正解です。
#VALUE!エラーの原因と対処
引数のセル参照先に文字列や空白セルが含まれると#VALUE!が発生します。データ入力直後に「’0.05」のようにシングルクォートが混入していないか確認してください。STDEV.Sが参照する範囲に空白行が混じっていないかも合わせて確認すると確実です。
また、size=1の場合は#NUM!ではなく#DIV/0!が返ります。「最低でもn≧2」という制約は覚えておきましょう。
合わせて使いたい関連関数(T.INV.2T / STDEV.S / AVERAGE)
CONFIDENCE.Tは単体で使うより、他の統計関数と組み合わせることで真価を発揮します。
STDEV.S:standard_dev引数の算出元
STDEV.S関数は標本標準偏差を求める関数です。CONFIDENCE.Tのstandard_dev引数は、ほとんどのケースでSTDEV.Sの結果を代入します。母標準偏差を使うSTDEV.Pとは役割が違う点に注意してください。
=CONFIDENCE.T(0.05, STDEV.S(A2:A16), COUNT(A2:A16))
AVERAGE:信頼区間の中心(標本平均)を求める
信頼区間は「標本平均 ± CONFIDENCE.T」で表現します。中心となる標本平均はAVERAGE関数で求めます。
下限: =AVERAGE(A2:A16) - CONFIDENCE.T(0.05, STDEV.S(A2:A16), COUNT(A2:A16))
上限: =AVERAGE(A2:A16) + CONFIDENCE.T(0.05, STDEV.S(A2:A16), COUNT(A2:A16))
T.INV.2T:CONFIDENCE.Tの内部で使われるt値の正体
CONFIDENCE.Tの計算式は t(alpha/2, n-1) × standard_dev / √size です。ここで使われる臨界値 t(alpha/2, n-1) は、T.INV.2T関数で直接確認できます。
=T.INV.2T(0.05, 14) → 自由度14(n=15時)の両側5%点 ≈ 2.145
CONFIDENCE.Tを使わず手計算する場合の分解式は次のようになります。
=T.INV.2T(alpha, size-1) * standard_dev / SQRT(size)
関数の内部動作を理解しておくと、統計的な意味を説明する際にも役立ちます。
実務上の注意
最後に、CONFIDENCE.Tを使うときに押さえておきたいポイントをまとめます。
- 正規性の前提: 元データが正規分布に従うことを前提とした関数です。強い偏りや大きな外れ値がある場合は、結果が歪む可能性があります
- 外れ値への敏感さ: STDEV.Sは外れ値に引きずられやすいため、standard_devが過大になり、信頼区間が広がりすぎることがあります
- 信頼区間の解釈: 「母平均がこの範囲にある確率が95%」ではなく、「同じ手順を繰り返すと95%のケースでこの範囲が母平均を含む」が正しい解釈です
- n=1は使用不可: 自由度0で#DIV/0!が発生します。最低でもn≧2を確保してください
- n<30の目安: 「n<30ではt分布」は慣習的なガイドラインです。nが大きくても母σ不明ならCONFIDENCE.Tを使うのが自然です
まとめ
CONFIDENCE.T関数は、母集団の標準偏差が不明な場面で標本データから信頼区間を求めるときの定番関数です。
- 構文は
=CONFIDENCE.T(alpha, standard_dev, size)の3引数 - 95%信頼区間ならalpha=0.05。standard_devにはSTDEV.Sを代入する
- 信頼区間の上下限は
AVERAGE ± CONFIDENCE.Tで求める - 母σ既知ならCONFIDENCE.NORM、母σ不明ならCONFIDENCE.Tを選ぶ
- 標本サイズが小さいほどCONFIDENCE.Tの区間は広くなる(t分布による補正)
- size=1は#DIV/0!、alphaの範囲外や非数値引数は#NUM!/#VALUE!エラー
アンケート分析、品質検査、小規模なマーケティング調査など、実務でCONFIDENCE.Tが活躍する場面は多くあります。AVERAGE・STDEV.S・CONFIDENCE.Tを組み合わせたテンプレ数式を1つ作っておくと、日々のデータ分析が一段とスムーズになります。
