スプレッドシートのCONFIDENCE.T関数の使い方|t分布の信頼区間

スポンサーリンク

スプレッドシートでアンケート結果や試作品の測定データをまとめたとき、「サンプル数が少ないけど、この平均値ってどれくらい信じていいの?」と悩むことはありませんか。母集団のばらつきが分からない状態で信頼区間を出したいとき、どの関数を選べばいいか迷いがちですよね。

そんなときに活躍するのが、スプレッドシートのCONFIDENCE.T関数です。t分布(標本数が少ないときに使う確率分布)をベースに、信頼区間の「半幅」をサッと返してくれます。母集団の標準偏差が分からなくても、手元の標本だけで見積もれるのが魅力ですよ。

この記事では、CONFIDENCE.T関数の構文から、自由度の意味、95%信頼区間のコピペ数式、CONFIDENCE.NORMとの使い分けまで、実務目線でまとめました。

スプレッドシートのCONFIDENCE.T関数とは?

スプレッドシートのCONFIDENCE.T関数は、t分布をベースに信頼区間の半幅(margin of error、推定誤差)を返す統計関数です。読み方は「コンフィデンス・ティー」。Confidence(信頼)と t分布の t を組み合わせた名前ですよ。

母集団の標準偏差(データ全体のばらつきの代表値)が未知で、手元の標本から推定するしかないときに使います。パイロット調査や試作品テストのように、サンプル数が30件未満の場面でも安心して使える頼もしい関数です。

関数の基本構文と引数

基本構文はとてもシンプルです。

=CONFIDENCE.T(alpha, standard_deviation, size)

引数の意味を整理しておきましょう。

引数意味指定範囲
alpha有意水準(信頼度を外した確率)0 < alpha < 1
standard_deviation標本標準偏差> 0
size標本の大きさ2以上の整数

alpha=0.05 は「信頼度95%」、alpha=0.01 は「信頼度99%」に対応します。「0.95を入れる」と間違えやすいので気をつけてくださいね。「信頼度から外した分の確率を入れる」と覚えると忘れにくいですよ。

内部ではどんな計算がされているか

CONFIDENCE.T の中身は、次の式で表せます。

CONFIDENCE.T(alpha, s, n) = T.INV.2T(alpha, n-1) × s / √n

s / √n は標準誤差(平均値のばらつきの目安)、T.INV.2T(alpha, n-1) は両側 t分布の臨界値です。n-1 が自由度(degrees of freedom、df)で、これが t分布の形を決める大事な数値ですよ。

具体例として =CONFIDENCE.T(0.05, 2.5, 10) を分解してみます。

  • 自由度: 10 − 1 = 9
  • T.INV.2T(0.05, 9) ≈ 2.2622
  • 標準誤差: 2.5 ÷ √10 ≈ 0.7906
  • 半幅: 2.2622 × 0.7906 ≈ 1.7884

手計算とも一致するので、安心して使えます。

CONFIDENCE関数・CONFIDENCE.NORMとの違い

スプレッドシートには似た名前の関数が3つあります。ざっくり整理するとこうなります。

  • CONFIDENCE: 旧互換関数(CONFIDENCE.NORM と同じ計算)
  • CONFIDENCE.NORM: 正規分布ベース(母σ既知・大標本向け)
  • CONFIDENCE.T: t分布ベース(母σ未知・小標本向け)

迷ったときは「母標準偏差を知っているか」を判断軸にしてください。兄弟関数についてはスプレッドシートのCONFIDENCE.NORM関数の使い方でも解説しています。あわせて読むと使い分けがくっきりしますよ。

なぜt分布を使うのか|母σ未知・小標本の意味

CONFIDENCE.T を使う前提は「母集団の標準偏差が分からないこと」。ここ、実務だとピンと来にくい場面ですよね。考え方を整理しておきましょう。

実務で母σが未知になるケース

身近な例を挙げてみます。

  • 新商品の試作品テストで、ばらつきの前例がない
  • パイロット調査でサンプル数が10〜20件しかない
  • 社内アンケートを初めて実施し、スコアのばらつきが分からない
  • 新設した製造ラインで、長期の測定データがまだない
  • 異なる供給元の素材で初回ロットを評価する

こうした場面では、標本から計算した標準偏差(STDEV.S の結果)を使うしかありません。標本σで信頼区間を組むなら、迷わず CONFIDENCE.T を選んでくださいね。

自由度(df = n − 1)が区間幅を左右する

t分布は自由度という値で形が変わります。自由度は「標本数 − 1」で計算され、CONFIDENCE.T の内部でも size−1 として使われています。

自由度が小さいほど t分布は裾が厚くなり、信頼区間の幅が広くなります。つまり標本数が少ないほど、保守的(広めの)見積もりになるということ。同じσでも n=5 のときと n=100 のときで、区間の広さがどれくらい違うかを表にしました。

標本数 n自由度 n−1T.INV.2T(0.05, n−1)σ=2.5 のときの半幅
54約 2.776約 3.10
109約 2.262約 1.79
3029約 2.045約 0.93
10099約 1.984約 0.50

n が小さいほど臨界値が大きくなり、半幅が広がるのが分かりますよね。サンプルが少ないほど「断言しにくいから幅を広めに取る」という、t分布の素直な性質です。

「小標本(n < 30)」と言われる理由

統計の世界では「n < 30 なら小標本」と言われます。中心極限定理(標本数が増えれば標本平均の分布が正規分布に近づく定理)が、n=30 あたりから実用的に効いてくるラインだからです。

正規分布の仮定が使いにくい小標本ほど、t分布の出番です。ちなみに n ≥ 30 であっても、母σが未知ならば CONFIDENCE.T を使うほうがより厳密ですよ。実務では「母σを知っているか」だけで判断するのがおすすめです。

CONFIDENCE.T関数の基本的な使い方

それでは実際に使ってみましょう。計算の流れは「有意水準 → 標本σ → 標本数」の順に指定するだけです。

引数の指定方法(有意水準・標本σ・標本数)

以下のサンプルで挙動を確認してみます。

=CONFIDENCE.T(0.05, 2.5, 10)

この式は「信頼度95%、標本σ=2.5、標本数10」での信頼区間の半幅を返します。結果は 約 1.7884 です。標本平均が30.0 だった場合、95%信頼区間は 28.21〜31.79 となります。

信頼度を変えると半幅はどう変わるか

同じデータでも、信頼度を上げると区間は広がります。σ=2.5、n=15 で比較してみましょう。

信頼度alpha数式半幅
90%0.10=CONFIDENCE.T(0.10, 2.5, 15)約 1.1366
95%0.05=CONFIDENCE.T(0.05, 2.5, 15)約 1.3845
99%0.01=CONFIDENCE.T(0.01, 2.5, 15)約 1.9225

「より確実に当てたい=幅を広くとる」という直感どおりの動きですよね。社内報告は95%、品質保証など厳しい用途では99%、というのが目安です。

実務シナリオ別の計算例

実務でよく出る3パターンを並べてみます。

シナリオ数式半幅
新商品アンケート(信頼度95%, σ=0.8, n=20)=CONFIDENCE.T(0.05, 0.8, 20)約 0.3744
試作品強度テスト(信頼度99%, σ=2.5, n=15)=CONFIDENCE.T(0.01, 2.5, 15)約 1.9225
新ライン初期検査(信頼度95%, σ=1.2, n=8)=CONFIDENCE.T(0.05, 1.2, 8)約 1.0029

たとえば試作品テストの結果が「平均25.0 MPa、半幅1.92」なら、「99%の確からしさで母平均は 23.08〜26.92 MPa の範囲にある」と読み取れます。サンプルが少なくても、ばらつきの幅を示せるのが信頼区間の強みです。

ちなみに同じデータでも、信頼度を下げれば区間は狭くなります。「狭い区間で言い切りたい」なら90%、「絶対外したくない」なら99%、というふうに目的に合わせて使い分けてください。報告書のレビューで「なぜ95%にしたのか?」と聞かれたときに、根拠を答えられるとぐっと信頼感が増しますよ。

信頼区間の上限・下限を求めるセット数式

CONFIDENCE.T が返すのは「半幅」だけなので、報告書に書くときは標本平均に足し引きして上下限を出す必要があります。テンプレ化しておくと便利ですよ。

AVERAGE+STDEV.S+COUNT との組み合わせ

A2:A21 に標本データが入っているとしましょう。95%信頼区間はこう書けます。

標本平均: =AVERAGE(A2:A21)
標本σ:   =STDEV.S(A2:A21)
下限:     =AVERAGE(A2:A21) - CONFIDENCE.T(0.05, STDEV.S(A2:A21), COUNT(A2:A21))
上限:     =AVERAGE(A2:A21) + CONFIDENCE.T(0.05, STDEV.S(A2:A21), COUNT(A2:A21))

STDEV.S(標本標準偏差を返す関数)と COUNT(数値セルの個数を数える関数)を組み合わせると、データが増えても手動更新せずに済みます。標本標準偏差についてはスプレッドシートのSTDEV.S関数の使い方で詳しく解説していますよ。

コピペで使える上下限テンプレート

別シートから IMPORTRANGE で取ってきたデータにもそのまま流用できます。セルに貼るだけで動くテンプレートを置いておきますね。

# B1セルに有意水準(0.05など)、データ範囲はA2:A21を想定
平均: =AVERAGE(A2:A21)
半幅: =CONFIDENCE.T(B1, STDEV.S(A2:A21), COUNT(A2:A21))
下限: =AVERAGE(A2:A21) - CONFIDENCE.T(B1, STDEV.S(A2:A21), COUNT(A2:A21))
上限: =AVERAGE(A2:A21) + CONFIDENCE.T(B1, STDEV.S(A2:A21), COUNT(A2:A21))

B1 の値を 0.05 → 0.01 に変えるだけで、95%信頼区間と99%信頼区間を切り替えられます。報告書テンプレートに組み込むと、毎回ゼロから書かずに済んで快適ですよ。

報告書での書き方サンプル

報告書に載せるときは、平均値と信頼区間をセットで書くのが基本です。次のような書式が読みやすいですよ。

試作品Aの引張強度(n=15, 標本σ=2.5)
平均: 25.0 MPa
99%信頼区間: 23.08 〜 26.92 MPa(半幅 ±1.92)

「n と σ を併記する」と、後から読んだ人が同じ計算を再現できます。データの透明性が一気に上がるので、ぜひ習慣にしてみてくださいね。

CONFIDENCE.NORM・CONFIDENCE との違いと使い分け

同じ入力値でも、CONFIDENCE.NORM と CONFIDENCE.T は結果が変わります。数字で比べると違いがハッキリしますよ。

同じ条件での数値比較

alpha=0.05、σ=2.5 に揃えて、標本数を変えた比較表です。

標本数CONFIDENCE.NORMCONFIDENCE.TT/NORM比
n=5約 2.1910約 3.1042+0.911.42倍
n=10約 1.5498約 1.7884+0.241.15倍
n=20約 1.0958約 1.1700+0.071.07倍
n=30約 0.8946約 0.9333+0.041.04倍
n=100約 0.4900約 0.4960+0.011.01倍

標本数が少ないほど CONFIDENCE.T のほうが広くなり、n=30 以上だと差がほぼ無くなるのが分かりますよね。これが「n ≥ 30 で正規分布に近づく」と言われる理由です。

判断フローチャート

迷ったらこの順に判断してみてください。

[スタート]
  │
  ▼
母集団の標準偏差が既知?
  │
  ├─ Yes ─→ 標本数は30件以上?
  │         ├─ Yes ─→ CONFIDENCE.NORM
  │         └─ No  ─→ CONFIDENCE.T(保守的に見積もる)
  │
  └─ No  ─→ CONFIDENCE.T

シンプルなルールですが、実務ではこの2択でほぼ迷わず選べますよ。Excel版との挙動比較をしたい場合は、ExcelのCONFIDENCE.T関数の使い方もあわせてチェックしてみてくださいね。

旧 CONFIDENCE 関数との関係

CONFIDENCE(旧関数)は CONFIDENCE.NORM と同じ計算結果を返します。互換性のために残されているだけなので、新しく書くなら CONFIDENCE.NORM か CONFIDENCE.T のどちらかを選ぶのがおすすめです。可読性の面でも、新しい関数名のほうが「正規分布ベースか t分布ベースか」が一目で分かって親切ですよ。

CONFIDENCE.T関数のよくあるエラーと対処法

CONFIDENCE.T でよく出るエラーは3つ。原因と対処をセットで覚えておきましょう。

#NUM! エラー

引数の範囲外が原因です。次のどれかに当てはまっていないか確認してみてください。

  • alpha が 0 以下、または 1 以上(例: 0.95 を入れてしまった)
  • standard_deviation が 0 以下
  • size が 2 未満(n=1 だと自由度0で計算不能)

一番多いのは「信頼度95%のつもりで 0.95 を alpha に入れてしまう」ミスです。alpha は「信頼度から外した分」なので、95%なら 0.05 を入れてくださいね。

#VALUE! エラー

引数に数値以外が入っているときに出ます。文字列が混じったセルを参照していないか見直してみましょう。COUNT ではなく COUNTA(空白以外のセル数を数える関数)を使ってしまっていないかも要チェックですよ。

データ範囲に「未測定」「N/A」などの文字列が混ざっていると、STDEV.S や AVERAGE がエラーを返すことがあります。空白セルや非数値セルは取り除いてから集計するのがコツです。

#NAME? エラー

関数名のスペルミスで出ます。「CONFIDENCE_T」「CONFIDENCET」と書いてしまうパターンが定番です。正しくは「CONFIDENCE.T」(ピリオド区切り)なので、ここを見直してみてくださいね。

想定と違う結果が返ってくる場合

数式はエラーにならないのに結果が変というときは、次の4点をチェックします。

  • STDEV.S ではなく STDEVP(母標準偏差)を使ってしまっていないか
  • 有意水準(0.05)と信頼度(0.95)を取り違えていないか
  • size に列全体を指定し、見出し行や空白行までカウントしていないか
  • 単位を揃え忘れていないか(mm と cm の混在など)

特に「STDEVP を使ってしまう」ミスは結果が微妙に小さく出るので気付きにくいです。母σ未知のシーンでは必ず STDEV.S(末尾 S は Sample の S)を選んでくださいね。Z検定や t検定との関係を整理したい場合は、スプレッドシートのZ.TEST関数の使い方も参考になりますよ。

なお、サンプルサイズが極端に少ない(n=2〜3)と、CONFIDENCE.T の半幅は非常に大きくなります。これはエラーではなく、t分布が小標本のばらつきを正しく反映しているだけです。「結果が広すぎて参考にならない」と感じたら、まずはサンプル数を増やす方向で検討してくださいね。

まとめ

スプレッドシートの CONFIDENCE.T 関数は、母σ未知・小標本のシーンで信頼区間の半幅を計算してくれる心強い統計関数です。最後に要点を整理しておきましょう。

  • 構文は =CONFIDENCE.T(alpha, standard_deviation, size) の3引数
  • alpha は「信頼度から外した確率」。95%なら 0.05 を指定する
  • 内部計算は T.INV.2T(alpha, n−1) × s / √n。自由度 n−1 が区間幅を左右する
  • 戻り値は信頼区間の半幅。AVERAGE と STDEV.S を組み合わせて上下限を出す
  • 母σ既知・n ≥ 30 なら CONFIDENCE.NORM、それ以外は CONFIDENCE.T
  • #NUM! は引数の範囲外、#VALUE! は数値以外、#NAME? はスペルミスが原因

まずは手元のパイロット調査データや試作品テスト結果で、95%信頼区間を算出してみてください。「平均±半幅、信頼度95%、n=○」と書く癖をつけるだけで、少ないサンプル数でも説得力のあるレポートが作れますよ。

タイトルとURLをコピーしました