スプレッドシートのCONFIDENCE.NORM関数の使い方|正規分布の信頼区間

スポンサーリンク

スプレッドシートでアンケート結果や品質データの平均を出したとき、「この平均値、どこまで信じていいの?」と不安になりますよね。標本の平均だけを報告すると、上司から「ばらつきは?」と突っ込まれがちです。困った経験はないでしょうか。

そんなときに使えるのが、スプレッドシートのCONFIDENCE.NORM関数です。正規分布(データが平均値まわりに左右対称に分布する確率モデル)をベースに、信頼区間の「半幅」をサッと計算してくれます。ここでいう信頼区間とは、平均値が収まると期待される数値の幅のことです。

この記事では、CONFIDENCE.NORM関数の構文から、95%信頼区間の上下限を求めるコピペ数式まで紹介します。CONFIDENCE・CONFIDENCE.Tとの使い分けも実務目線でまとめました。

スプレッドシートのCONFIDENCE.NORM関数とは?

スプレッドシートのCONFIDENCE.NORM関数は、正規分布をベースに信頼区間の半幅(margin of error、推定誤差)を返す統計関数です。読み方は「コンフィデンス・ノーム」で、Confidence(信頼)と Normal distribution(正規分布)を組み合わせた名前ですよ。

アンケートの満足度スコアや製造ラインの重量測定などで活躍します。母集団の標準偏差(データのばらつきの代表値)がわかっているときに、標本平均の信用度を数値で表せるのが魅力ですよ。

関数の基本構文と引数

基本構文はとてもシンプルです。

=CONFIDENCE.NORM(alpha, standard_deviation, pop_size)

引数の意味を整理しておきましょう。

引数意味指定範囲
alpha有意水準(信頼度を外した確率)0 < alpha < 1
standard_deviation母集団の標準偏差> 0
pop_size標本の大きさ1以上の整数(小数は切り捨て)

alpha=0.05 は「信頼度95%」、alpha=0.01 は「信頼度99%」に対応します。ここを「0.95を入れる」と間違えやすいので、注意してくださいね。

CONFIDENCE関数(旧)・CONFIDENCE.Tとの違い

スプレッドシートには似た名前の関数が3つあります。まず違いをざっくり掴んでおきましょう。

  • CONFIDENCE: 旧互換関数。計算結果はCONFIDENCE.NORMと完全に同じです
  • CONFIDENCE.NORM: 正規分布ベースの正式な後継関数(母σ既知・大標本向け)
  • CONFIDENCE.T: t分布ベース(母σ未知・小標本向け)

互換関数の詳細はスプレッドシートのCONFIDENCE関数の使い方で解説しています。あわせて確認してみてくださいね。

母標準偏差が「既知」とはどういう意味か

CONFIDENCE.NORMを使うときの前提は「母集団の標準偏差がわかっていること」です。ここ、統計の入門書では当たり前のように語られますが、実務ではピンと来にくいですよね。

実務で母標準偏差が手に入るケース

意外と身近なシーンで母σが使えます。

  • 製造ラインの過去数年分の測定データから算出された、製品重量のばらつき
  • コールセンターの過去の応答時間の標準偏差
  • 定期的に同じアンケートを取っていて、スコアのばらつきが安定しているケース

「まだ過去データがない」「サンプルが30件未満」というときは、CONFIDENCE.NORMではなくCONFIDENCE.Tを使うのが一般的です。標本数が30件以上あるかどうかも、選択の目安にしてくださいね。

CONFIDENCE.NORM関数の基本的な使い方

それでは実際に使ってみましょう。計算の流れは「有意水準 → 母σ → 標本数」の順に指定するだけです。

引数の指定方法(有意水準・標準偏差・標本数)

以下のサンプルで挙動を確認してみます。

=CONFIDENCE.NORM(0.05, 2.5, 50)

この式は「信頼度95%、母σ=2.5、標本数50」での信頼区間の半幅を返します。結果は 約0.692952 です。

これは内部的に z(0.025) × 2.5 / √50 という計算をしています。z(0.025) は約1.95996(いわゆる1.96)で、正規分布表の両側2.5%点です。NORM.S.INV(標準正規分布の逆関数を返す関数)を使うと自分でも再現できますよ。

信頼区間の計算例(アンケート・品質管理シナリオ)

実務でよく出るパターンを3つ並べてみましょう。

シナリオ数式半幅(結果)
アンケート満足度(信頼度95%, σ=0.8, n=100)=CONFIDENCE.NORM(0.05, 0.8, 100)約 0.1568
品質管理(信頼度99%, σ=2.5, n=50)=CONFIDENCE.NORM(0.01, 2.5, 50)約 0.9103
傾向把握(信頼度90%, σ=2.5, n=50)=CONFIDENCE.NORM(0.10, 2.5, 50)約 0.5816

信頼度を上げる(alphaを小さくする)ほど、区間の幅は広くなります。「より確実に当てたい=幅を広くとる」という直感どおりの動きですよね。

信頼区間の上限・下限を求めるセット数式

CONFIDENCE.NORMが返すのは「半幅」だけなので、報告書に書くときは標本平均に足し引きして上下限を出す必要があります。

AVERAGE+CONFIDENCE.NORMで上下限を計算

A2:A51に標本データが入っているとしましょう。母σが 2.5 とわかっているとき、95%信頼区間はこう書けます。

標本平均: =AVERAGE(A2:A51)
下限:     =AVERAGE(A2:A51) - CONFIDENCE.NORM(0.05, 2.5, COUNT(A2:A51))
上限:     =AVERAGE(A2:A51) + CONFIDENCE.NORM(0.05, 2.5, COUNT(A2:A51))

COUNT(範囲内の数値セル数を数える関数)を組み合わせると、データが増えても標本数を手動更新せずに済むのでおすすめですよ。

コピーして使えるセット数式テンプレート

別シートのIMPORTRANGEで取得したデータにもそのまま流用できます。セルに貼るだけで動くテンプレートを置いておきますね。

# セルB1に「母標準偏差」、B2に「有意水準」、データ範囲はA2:A51を想定
=AVERAGE(A2:A51) - CONFIDENCE.NORM(B2, B1, COUNT(A2:A51))
=AVERAGE(A2:A51) + CONFIDENCE.NORM(B2, B1, COUNT(A2:A51))

B1・B2の値を変えるだけで、信頼度や想定ばらつきを切り替えて再計算できます。報告書テンプレートに組み込んでおくと、毎回ゼロから書かずに済んで便利です。

CONFIDENCE vs CONFIDENCE.NORM vs CONFIDENCE.T 使い分けフロー

3関数の使い分けは、次の2つで判断できます。

正規分布を使う条件(母σ既知・標本30件以上)

次の条件がそろうなら、CONFIDENCE.NORMが最適です。

  • 母集団の標準偏差が過去データなどからわかっている
  • 標本数が30件以上ある
  • データがおおむね正規分布に近い

既存のCONFIDENCE関数で書かれたシートを引き継いだ場合は、計算結果が同じなのでそのまま動きます。新規作成するなら正式名のCONFIDENCE.NORMを選ぶのがおすすめですよ。

t分布を使う条件(母σ未知・少量標本)

母σがわからず、標本しか手元にないケースではCONFIDENCE.Tを使います。具体的には次のような場面です。

  • パイロット調査でサンプル数が10〜20件しかない
  • 新商品の試作品テストで、ばらつきの前例がない
  • 社内アンケートで「ひとまず計算してみたい」

母σ未知での計算は標本ばらつきを使うため、区間が少し広めに出ます。慎重な見積もりになるので、経営報告でも安心して使えますよ。

判断フローチャート

迷ったらこの順に判断してみてください。

[スタート]
  │
  ▼
母集団の標準偏差がわかっている?
  │
  ├─ Yes ─→ 標本数は30件以上?
  │         ├─ Yes ─→ CONFIDENCE.NORM
  │         └─ No  ─→ CONFIDENCE.T(保守的に見積もる)
  │
  └─ No  ─→ CONFIDENCE.T

よくあるエラーと対処法

CONFIDENCE.NORMでよく出るエラーは2つです。原因と対処をセットで覚えておくと、現場で詰まりにくくなりますよ。

“#NUM!” エラー

引数の範囲外が原因です。次のどれかに当てはまっていないか確認してみてください。

  • alpha が 0 以下、または 1 以上(例: 0.95 を入れてしまった)
  • standard_deviation が 0 以下
  • pop_size が 1 未満(0 件や負の数)

一番多いのは「信頼度95%のつもりで 0.95 を alpha に入れてしまう」ミスです。alphaは「信頼度から外した分」なので、95%なら 0.05 を入れてくださいね。

“#VALUE!” エラー

引数に数値以外が入っているときに出ます。文字列が混じったセルを参照していないかを見直してみましょう。COUNT ではなく COUNTA(空白以外のセル数を数える関数)を使ってしまっていないかも要チェックですよ。

想定と違う結果が返ってくる場合

数式はエラーにならないのに結果が変というときは、次の3点をチェックします。

  • 母σと標本σを取り違えていないか
  • 有意水準と信頼度を取り違えていないか
  • pop_sizeに「列全体」を指定してしまい、見出し行や空白行までカウントしていないか

Excel版との挙動比較をしたいときは、ExcelのCONFIDENCE.NORM関数の使い方も参考になります。

まとめ

スプレッドシートのCONFIDENCE.NORM関数は、母σが既知の状況で信頼区間の半幅を計算してくれる便利な統計関数です。最後に要点を整理しておきましょう。

  • 構文は =CONFIDENCE.NORM(alpha, standard_deviation, pop_size) の3引数
  • alpha は「信頼度から外した確率」。95%なら 0.05 を指定する
  • 戻り値は信頼区間の半幅。AVERAGE と組み合わせて上下限を出す
  • 母σ未知・小標本ならCONFIDENCE.Tに切り替える
  • #NUM! は引数の範囲外、#VALUE! は数値以外の混入が原因

まずは手元のアンケートや測定データで、95%信頼区間を算出してみてください。「平均+半幅」で報告する癖をつけるだけで、データの説得力がぐっと上がりますよ。

タイトルとURLをコピーしました