スプレッドシートのCONFIDENCE.NORM関数の使い方|正規分布の信頼区間

スポンサーリンク

アンケートや品質データの平均値を上司に報告したら、「で、ばらつきは?」と返されて困った経験はありませんか。標本平均だけでは、数値の信用度を伝えきれません。

そんなときに役立つのが、スプレッドシートのCONFIDENCE.NORM関数です。正規分布をベースに、信頼区間の「半幅」をワンショットで計算してくれます。信頼区間とは、母平均が収まると期待される数値の幅のことです。

この記事では、CONFIDENCE.NORM関数の構文から、95%信頼区間の上下限をコピペで出すセット数式まで紹介します。CONFIDENCE・CONFIDENCE.Tとの使い分けや、よくあるエラー対処もあわせてまとめました。

スプレッドシートのCONFIDENCE.NORM関数とは?

スプレッドシートのCONFIDENCE.NORM関数は、信頼区間の半幅を返す統計関数です。正規分布(データが平均値まわりに左右対称に分布する確率モデル)をベースに、推定誤差(margin of error)を計算します。読み方は「コンフィデンス・ノーム」。Confidence(信頼)と Normal distribution(正規分布)を組み合わせた名前ですよ。

アンケートの満足度スコアや製造ラインの重量測定などで活躍します。母集団の標準偏差(データのばらつきの代表値、以下「母σ」)がわかっているときに使えます。標本平均の信用度を数値で表現できる、これが大きな魅力です。

関数の基本構文と引数

基本構文はとてもシンプルです。

=CONFIDENCE.NORM(alpha, standard_deviation, pop_size)

引数の意味を整理しておきましょう。

引数意味指定範囲
alpha有意水準(信頼度を外した確率)0 < alpha < 1
standard_deviation母集団の標準偏差(母σ)> 0
pop_size標本の大きさ1以上の整数(小数は切り捨て)

alpha=0.05 は「信頼度95%」、alpha=0.01 は「信頼度99%」に対応します。「0.95を入れる」と勘違いしやすいポイントなので、注意してくださいね。

内部ではどんな計算がされているか

CONFIDENCE.NORMの中身は、次の式と同じです。

半幅 = z(1 - alpha/2) × standard_deviation / √pop_size

z(1 – alpha/2) は標準正規分布の上側alpha/2点の値です。信頼度95%なら z(0.975) ≈ 1.959964 で、よく言われる「1.96」ですね。NORM.S.INV関数(標準正規分布の逆関数を返す関数)を使うと自分で再現できます。

=NORM.S.INV(1 - 0.05/2)   → 約 1.959964

「ブラックボックス感」が苦手な方は、一度この式と突き合わせて検算してみると安心ですよ。NORM.S.INVの詳細はスプレッドシートのNORM.S.INV関数の使い方で解説しています。

CONFIDENCE関数(旧)・CONFIDENCE.Tとの違い

スプレッドシートには似た名前の関数が3つあります。まず違いをざっくり掴んでおきましょう。

  • CONFIDENCE: 旧互換関数。計算結果はCONFIDENCE.NORMと完全に同じです
  • CONFIDENCE.NORM: 正規分布ベースの正式な後継関数(母σ既知・大標本向け)
  • CONFIDENCE.T: t分布ベース(母σ未知・小標本向け)

互換関数の詳細はスプレッドシートのCONFIDENCE関数の使い方で解説しています。あわせて確認してみてくださいね。

母標準偏差が「既知」とはどういう意味か

CONFIDENCE.NORMを使うときの前提は「母集団の標準偏差がわかっていること」です。ここ、統計の入門書では当たり前のように語られますが、実務だとピンと来にくいですよね。

実務で母標準偏差が手に入るケース

意外と身近なシーンで母σは手に入ります。

  • 製造ラインの過去数年分の測定データから算出された、製品重量のばらつき
  • コールセンターの過去の応答時間の標準偏差
  • 定期的に同じアンケートを取っていて、スコアのばらつきが安定しているケース
  • 同一規格部品の単重チェックで、過去ロットのσが安定しているケース

「まだ過去データがない」「サンプルが30件未満」というときは、CONFIDENCE.NORMではなくCONFIDENCE.Tを使うのが一般的です。標本数が30件以上あるかどうかも、選択の目安にしてくださいね。

母σが「ほぼ既知」と扱っていいライン

厳密に言えば、母σは標本からは完全には知り得ません。実務では次の条件がそろえば「既知扱い」でCONFIDENCE.NORMを使う運用が一般的です。

  • 過去2〜3年分以上の蓄積データがある
  • ばらつきの傾向が大きく変動していない(工程・運用条件が安定)
  • 標本数が30件以上ある

過去データが少なかったり、ばらつきが変動しやすかったりする場合は、CONFIDENCE.Tに切り替えると安全ですよ。

CONFIDENCE.NORM関数の基本的な使い方

それでは実際に使ってみましょう。計算の流れは「有意水準 → 母σ → 標本数」の順に指定するだけです。

引数の指定方法(有意水準・標準偏差・標本数)

以下のサンプルで挙動を確認してみます。

=CONFIDENCE.NORM(0.05, 2.5, 50)

この式は「信頼度95%、母σ=2.5、標本数50」での信頼区間の半幅を返します。結果は 約0.692952 です。

内部では 1.959964 × 2.5 / √50 を計算しています。NORM.S.INVと組み合わせて検算してみるとこんな感じです。

=NORM.S.INV(1 - 0.05/2) * 2.5 / SQRT(50)   → 約 0.692952

CONFIDENCE.NORMの結果と一致しますよね。

信頼度を変えると半幅はどう変わるか

実務でよく使う信頼度を3パターン並べてみましょう。母σ=2.5、標本数=50で固定して比較します。

信頼度alpha数式半幅(結果)
90%0.10=CONFIDENCE.NORM(0.10, 2.5, 50)約 0.5816
95%0.05=CONFIDENCE.NORM(0.05, 2.5, 50)約 0.6930
99%0.01=CONFIDENCE.NORM(0.01, 2.5, 50)約 0.9103

信頼度を上げる(alphaを小さくする)ほど、区間の幅は広くなります。「より確実に当てたいなら幅も広くとる」という直感どおりの動きですよね。

実務シナリオ別の計算例

引数の組み合わせも、実務シーンに合わせて変わります。代表的な3パターンを並べてみます。

シナリオ数式半幅(結果)
アンケート満足度(信頼度95%, σ=0.8, n=100)=CONFIDENCE.NORM(0.05, 0.8, 100)約 0.1568
品質管理(信頼度99%, σ=2.5, n=50)=CONFIDENCE.NORM(0.01, 2.5, 50)約 0.9103
工程変動把握(信頼度90%, σ=2.5, n=50)=CONFIDENCE.NORM(0.10, 2.5, 50)約 0.5816

標本数 n が大きいほど半幅は小さくなります。「サンプルを増やせば信頼区間は狭くなる」という関係も、数式を眺めるとそのまま見えてきますよ。

信頼区間の上限・下限を求めるセット数式

CONFIDENCE.NORMが返すのは「半幅」だけです。報告書に書くときは、標本平均に足し引きして上下限を出す必要があります。

AVERAGE + COUNT + CONFIDENCE.NORM の組み合わせ

A2:A51に標本データが入っているとしましょう。母σが 2.5 とわかっているとき、95%信頼区間はこう書けます。

標本平均: =AVERAGE(A2:A51)
下限:     =AVERAGE(A2:A51) - CONFIDENCE.NORM(0.05, 2.5, COUNT(A2:A51))
上限:     =AVERAGE(A2:A51) + CONFIDENCE.NORM(0.05, 2.5, COUNT(A2:A51))

COUNT(範囲内の数値セル数を数える関数)を組み合わせると、データが増えても標本数を手動更新せずに済みます。

AVERAGEやCOUNTの基本はスプレッドシートのAVERAGE関数の使い方スプレッドシートのCOUNT関数の使い方もあわせてどうぞ。

COUNTA関数(空白以外のセル数を数える関数)を使うと、文字列までカウントしてしまい n がズレます。CONFIDENCE.NORMには必ずCOUNTを使ってくださいね。

コピペで使える上下限テンプレート

別シートのIMPORTRANGEで取得したデータにもそのまま流用できます。セルに貼るだけで動くテンプレートを置いておきますね。

# セルB1に「母標準偏差」、B2に「有意水準」、データ範囲はA2:A51を想定
標本平均: =AVERAGE(A2:A51)
下限    : =AVERAGE(A2:A51) - CONFIDENCE.NORM($B$2, $B$1, COUNT(A2:A51))
上限    : =AVERAGE(A2:A51) + CONFIDENCE.NORM($B$2, $B$1, COUNT(A2:A51))

B1・B2の値を変えるだけで、信頼度や想定ばらつきを切り替えて再計算できます。報告書テンプレートに組み込んでおくと、毎回ゼロから書かずに済んで便利ですよ。

報告書での書き方サンプル

数式から得た上下限は、報告書ではこんな形にまとめると伝わりやすいです。

平均満足度: 4.21(95%信頼区間 4.05 〜 4.37、n=100、母σ=0.8)

「平均値だけでなく、信頼区間とサンプルサイズも併記する」癖をつけるだけで、報告のクオリティはぐっと上がりますよ。

CONFIDENCE vs CONFIDENCE.NORM vs CONFIDENCE.T の使い分け

3関数の使い分けは、次の2点で判断できます。

  • 母σが既知か未知か
  • 標本数が30件以上か未満か

関数別の特徴を一覧で整理

関数ベース分布母σ推奨標本数備考
CONFIDENCE正規分布既知30件以上旧互換。結果はCONFIDENCE.NORMと同一
CONFIDENCE.NORM正規分布既知30件以上現行の正式名。新規シートはこちらを優先
CONFIDENCE.Tt分布未知(標本σ使用)30件未満でも可区間が広めに出る(保守的)

既存シートでCONFIDENCEが使われていても、戻り値はCONFIDENCE.NORMと完全に一致します。書き換えなくてもそのまま動きますよ。新規作成するときは、正式名のCONFIDENCE.NORMを選ぶのがおすすめです。

t分布を使う条件(母σ未知・少量標本)

母σがわからず、標本データしか手元にないケースではCONFIDENCE.Tを使います。具体的には次のような場面です。

  • パイロット調査でサンプル数が10〜20件しかない
  • 新商品の試作品テストで、ばらつきの前例がない
  • 社内アンケートで「ひとまず計算してみたい」

母σ未知での計算は標本ばらつきを使うため、区間は少し広めに出ます。慎重な見積もりになるので、経営報告でも安心して使えますよ。詳しくはスプレッドシートのCONFIDENCE.T関数の使い方で解説しています。

判断フローチャート

迷ったらこの順に判断してみてください。

[スタート]
  │
  ▼
母集団の標準偏差がわかっている?
  │
  ├─ Yes ─→ 標本数は30件以上?
  │         ├─ Yes ─→ CONFIDENCE.NORM(または旧 CONFIDENCE)
  │         └─ No  ─→ CONFIDENCE.T(保守的に見積もる)
  │
  └─ No  ─→ CONFIDENCE.T

Excelでも同じ関数が使えます。Excel版の挙動と比較したい場合はExcelのCONFIDENCE.NORM関数の使い方も参考になりますよ。

CONFIDENCE.NORM関数のよくあるエラーと対処法

CONFIDENCE.NORMでよく出るエラーは2つです。原因と対処をセットで覚えておくと、現場で詰まりにくくなります。

“#NUM!” エラー

引数の範囲外が原因です。次のどれかに当てはまっていないか確認してみてください。

引数NGになる条件
alpha0以下、または1以上0.95、-0.1、1.5
standard_deviation0以下0、-2.5
pop_size1未満0、-1

一番多いのは「信頼度95%のつもりで 0.95 を alpha に入れてしまう」ミスです。alphaは「信頼度から外した分」なので、95%なら 0.05 を入れてくださいね。

“#VALUE!” エラー

引数に数値以外が入っているときに出ます。次の2点をチェックしましょう。

  • alpha や standard_deviation の参照セルに文字列が混ざっていないか
  • pop_size に COUNTA を使ってしまっていないか(COUNTA は文字列もカウントする)

CONFIDENCE.NORM には必ずCOUNTを使うと安全ですよ。

想定と違う結果が返ってくる場合

数式はエラーにならないのに結果が変というときは、次の3点をチェックします。

  • 母σと標本σを取り違えていないか
  • 有意水準と信頼度を取り違えていないか(0.05と0.95の混同)
  • pop_sizeに「列全体」を指定してしまい、見出し行や空白行までカウントしていないか

特に列全体(A:A)を指定するとヘッダー行もカウントされて n がズレます。データ範囲は A2:A51 のように明示するのが安全ですよ。

まとめ

スプレッドシートのCONFIDENCE.NORM関数は、母σが既知の状況で信頼区間の半幅を計算してくれる便利な統計関数です。最後に要点を整理しておきましょう。

  • 構文は =CONFIDENCE.NORM(alpha, standard_deviation, pop_size) の3引数
  • alpha は「信頼度から外した確率」。95%なら 0.05 を指定する
  • 戻り値は信頼区間の半幅。AVERAGE と組み合わせて上下限を出す
  • 標本数 n には COUNTA ではなく COUNT を使う
  • 母σ未知・小標本ならCONFIDENCE.Tに切り替える
  • #NUM! は引数の範囲外、#VALUE! は数値以外の混入が原因

まずは手元のアンケートや測定データで、95%信頼区間を算出してみてください。「平均+半幅」で報告する癖をつけるだけで、データの説得力がぐっと上がりますよ。

タイトルとURLをコピーしました