スプレッドシートのCONFIDENCE.T関数の使い方|t分布の信頼区間

スポンサーリンク

スプレッドシートでアンケート結果や試作品の測定データをまとめたとき、「サンプル数が少ないけど、この平均値ってどれくらい信じていいの?」と悩むことはありませんか。母集団のばらつきが分からない状態で信頼区間を出したいとき、関数選びに迷いがちですよね。

そんなときに活躍するのが、スプレッドシートのCONFIDENCE.T関数です。t分布(標本数が少ないときに使う確率分布)をベースに、信頼区間の「半幅」をサッと返してくれます。母集団の標準偏差が分からなくても、手元の標本だけで見積もれるのが魅力ですよ。

この記事では、CONFIDENCE.T関数の構文から95%信頼区間のコピペ数式、CONFIDENCE.NORMとの使い分けまで実務目線でまとめました。

スプレッドシートのCONFIDENCE.T関数とは?

スプレッドシートのCONFIDENCE.T関数は、t分布をベースに信頼区間の半幅(margin of error、推定誤差)を返す統計関数です。読み方は「コンフィデンス・ティー」。Confidence(信頼)とt分布のtを組み合わせた名前ですよ。

母集団の標準偏差(データ全体のばらつきの代表値)が未知で、手元の標本から推定するしかないときに使います。パイロット調査や試作品テストのように、サンプル数が30件未満の場面でも安心して使える頼もしい関数です。

関数の基本構文と引数

基本構文はとてもシンプルです。

=CONFIDENCE.T(alpha, standard_deviation, size)

引数の意味を整理しておきましょう。

引数意味指定範囲
alpha有意水準(信頼度を外した確率)0 < alpha < 1
standard_deviation標本標準偏差> 0
size標本の大きさ2以上の整数

alpha=0.05 は「信頼度95%」、alpha=0.01 は「信頼度99%」に対応します。「0.95を入れる」と間違えやすいので気をつけてくださいね。

内部的には T.INV.2T(alpha, size-1) × standard_deviation / √size という計算をしています。size-1 が自由度(df)で、これがt分布の形を決める大事な数値です。

CONFIDENCE.NORMとの違い

スプレッドシートには似た名前の関数が3つあります。ざっくり整理するとこうなります。

  • CONFIDENCE: 旧互換関数(CONFIDENCE.NORMと同じ計算)
  • CONFIDENCE.NORM: 正規分布ベース(母σ既知・大標本向け)
  • CONFIDENCE.T: t分布ベース(母σ未知・小標本向け)

兄弟関数についてはスプレッドシートのCONFIDENCE.NORM関数の使い方でも解説しています。あわせて読むと使い分けがくっきりしますよ。

母標準偏差が「未知」「小標本」とはどういう意味か

CONFIDENCE.Tを使う前提は「母集団の標準偏差が分からない」こと。ここ、実務だとピンと来にくい場面ですよね。

実務で母σが未知になるケース

身近な例を挙げてみます。

  • 新商品の試作品テストで、ばらつきの前例がない
  • パイロット調査でサンプル数が10〜20件しかない
  • 社内アンケートを初めて実施し、スコアのばらつきが分からない
  • 新設した製造ラインで、長期の測定データがまだない

こうした場面では、標本から計算した標準偏差(STDEV.S の結果)を使うしかありません。標本σで信頼区間を組むなら、迷わずCONFIDENCE.Tを選んでくださいね。

自由度(df = n-1)の意味

t分布は自由度という値で形が変わります。自由度は「標本数 – 1」で計算され、CONFIDENCE.Tの内部でも size-1 として使われます。

自由度が小さいほどt分布は裾が厚くなり、信頼区間の幅が広くなります。つまり標本数が少ないほど、保守的な見積もりになるということ。n=5 のときと n=100 のときで、同じσでも区間の広さが大きく違ってくるんですよ。

小標本(n

統計の世界では「n<30なら小標本」と言われます。正規分布の近似が効きにくいラインだからです。標本数が少なくて正規分布の仮定が使えないときこそ、CONFIDENCE.Tの出番ですよ。

ちなみに n>=30 であっても、母σが未知なら CONFIDENCE.T を使うのがより厳密な作法です。実務では「母σが分かっているか」を判断軸にするのがおすすめです。

CONFIDENCE.T関数の基本的な使い方

それでは実際に使ってみましょう。計算の流れは「有意水準 → 標本σ → 標本数」の順に指定するだけです。

引数の指定方法(有意水準・標本σ・標本数)

以下のサンプルで挙動を確認してみます。

=CONFIDENCE.T(0.05, 2.5, 10)

この式は「信頼度95%、標本σ=2.5、標本数10」での信頼区間の半幅を返します。結果は 約1.7884 です。

内部的には T.INV.2T(0.05, 9) × 2.5 / √10 を計算していて、自由度9のt値は約2.262。2.262 × 2.5 ÷ 3.162 ≈ 1.7884 という流れです。手計算とも一致するので、安心して使えますよ。

信頼区間の計算例(アンケート・試作テストシナリオ)

実務でよく出るパターンを3つ並べてみましょう。

シナリオ数式半幅(結果)
新商品アンケート(信頼度95%, 標本σ=0.8, n=20)=CONFIDENCE.T(0.05, 0.8, 20)約 0.3744
試作品テスト(信頼度99%, 標本σ=2.5, n=15)=CONFIDENCE.T(0.01, 2.5, 15)約 1.9225
傾向把握(信頼度90%, 標本σ=2.5, n=15)=CONFIDENCE.T(0.10, 2.5, 15)約 1.1366

信頼度を上げる(alphaを小さくする)ほど、区間の幅は広くなります。「より確実に当てたい=幅を広くとる」という直感どおりの動きですよね。

信頼区間の上限・下限を求めるセット数式

CONFIDENCE.Tが返すのは「半幅」だけなので、報告書に書くときは標本平均に足し引きして上下限を出す必要があります。

AVERAGE+STDEV.S+CONFIDENCE.Tで上下限を計算

A2:A21に標本データが入っているとしましょう。95%信頼区間はこう書けます。

標本平均: =AVERAGE(A2:A21)
標本σ:   =STDEV.S(A2:A21)
下限:     =AVERAGE(A2:A21) - CONFIDENCE.T(0.05, STDEV.S(A2:A21), COUNT(A2:A21))
上限:     =AVERAGE(A2:A21) + CONFIDENCE.T(0.05, STDEV.S(A2:A21), COUNT(A2:A21))

STDEV.S(標本標準偏差を返す関数)と COUNT(数値セルの個数を数える関数)を組み合わせると、データが増えても手動更新せずに済みます。便利ですよ。

コピーして使えるセット数式テンプレート

別シートからIMPORTRANGEで取ってきたデータにもそのまま流用できます。セルに貼るだけで動くテンプレートを置いておきますね。

# セルB1に「有意水準」、データ範囲はA2:A21を想定
=AVERAGE(A2:A21) - CONFIDENCE.T(B1, STDEV.S(A2:A21), COUNT(A2:A21))
=AVERAGE(A2:A21) + CONFIDENCE.T(B1, STDEV.S(A2:A21), COUNT(A2:A21))

B1の値を 0.05 → 0.01 に変えるだけで、95%信頼区間と99%信頼区間を切り替えられます。報告書テンプレートに組み込むと、毎回ゼロから書かずに済んで快適ですよ。

CONFIDENCE.NORMとの違いと使い分け

同じ入力値でも、CONFIDENCE.NORMとCONFIDENCE.Tは結果が変わります。数字で比べると分かりやすいですよ。

同じ条件での数値比較

alpha=0.05、σ=2.5 に揃えて、標本数を変えた比較表です。

標本数CONFIDENCE.NORMCONFIDENCE.T
n=5約 2.1908約 3.1042+0.91
n=10約 1.5498約 1.7884+0.24
n=30約 0.8946約 0.9333+0.04
n=100約 0.4900約 0.4960+0.01

標本数が少ないほど CONFIDENCE.T のほうが広くなり、n=30以上だと差がほぼ無くなるのが分かりますよね。これが「n>=30で正規分布に近づく」と言われる理由です。

判断フローチャート

迷ったらこの順に判断してみてください。

[スタート]
  │
  ▼
母集団の標準偏差が既知?
  │
  ├─ Yes ─→ 標本数は30件以上?
  │         ├─ Yes ─→ CONFIDENCE.NORM
  │         └─ No  ─→ CONFIDENCE.T(保守的に見積もる)
  │
  └─ No  ─→ CONFIDENCE.T

シンプルなルールですが、実務ではこの2択でほぼ迷わず選べますよ。Excel版との挙動比較をしたい場合は、ExcelのCONFIDENCE.T関数の使い方もあわせてチェックしてみてくださいね。

よくあるエラーと対処法

CONFIDENCE.Tでよく出るエラーは3つ。原因と対処をセットで覚えておきましょう。

“#NUM!” エラー

引数の範囲外が原因です。次のどれかに当てはまっていないか確認してみてください。

  • alpha が 0 以下、または 1 以上(例: 0.95 を入れてしまった)
  • standard_deviation が 0 以下
  • size が 2 未満(n=1 だと自由度0で計算不能)

一番多いのは「信頼度95%のつもりで 0.95 を alpha に入れてしまう」ミスです。alphaは「信頼度から外した分」なので、95%なら 0.05 を入れてくださいね。

“#VALUE!” エラー

引数に数値以外が入っているときに出ます。文字列が混じったセルを参照していないか見直してみましょう。COUNT ではなく COUNTA(空白以外のセル数を数える関数)を使ってしまっていないかも要チェックですよ。

“#NAME?” エラー

関数名のスペルミスで出ます。「CONFIDENCE_T」「CONFIDENCET」と書いてしまうパターンが定番です。正しくは「CONFIDENCE.T」(ピリオド区切り)なので、ここを見直してみてくださいね。

想定と違う結果が返ってくる場合

数式はエラーにならないのに結果が変というときは、次の3点をチェックします。

  • STDEV.S ではなく STDEVP(母標準偏差)を使ってしまっていないか
  • 有意水準と信頼度を取り違えていないか
  • size に「列全体」を指定してしまい、見出し行や空白行までカウントしていないか

Z検定との関係を整理したい場合は、スプレッドシートのZ.TEST関数の使い方も参考になりますよ。

まとめ

スプレッドシートのCONFIDENCE.T関数は、母σ未知・小標本のシーンで信頼区間の半幅を計算してくれる心強い統計関数です。最後に要点を整理しておきましょう。

  • 構文は =CONFIDENCE.T(alpha, standard_deviation, size) の3引数
  • alpha は「信頼度から外した確率」。95%なら 0.05 を指定する
  • 戻り値は信頼区間の半幅。AVERAGE と STDEV.S を組み合わせて上下限を出す
  • 母σ既知・n>=30ならCONFIDENCE.NORM、それ以外はCONFIDENCE.T
  • #NUM! は引数の範囲外、#VALUE! は数値以外、#NAME? はスペルミスが原因

まずは手元のパイロット調査データや試作品テスト結果で、95%信頼区間を算出してみてください。「平均±半幅」で報告する癖をつけるだけで、少ないサンプル数でも説得力のあるレポートが作れますよ。

タイトルとURLをコピーしました