スプレッドシートのGAUSS関数の使い方|標準正規分布の累積確率

スポンサーリンク

「テストの点数が上位何%に入るか、スプレッドシートでサクッと計算できないかな?」。こんな場面に遭遇したことはありませんか?

平均からどれくらい離れているかをもとに確率を求めたい場面は、成績分析や品質管理で意外と出てきます。そこで使えるのがGAUSS関数です。標準正規分布の「平均からの確率(面積)」を一発で返してくれます。

この記事ではGAUSS関数の基本的な使い方から、テスト成績の分析やNORMSDIST関数との違いまで解説します。

GAUSS関数とは?標準正規分布の累積確率を求める関数

GAUSS関数(読み方: ガウス関数)は、標準正規分布において平均(0)からz値までの確率を求める関数です。「GAUSS」は数学者カール・フリードリヒ・ガウスの名前に由来しています。標準正規分布とは、あの釣り鐘型のグラフ(ベルカーブ)のことですね。

もう少しかみ砕くと、「釣り鐘の中央(平均)から、指定した位置までの面積」を返します。この面積がそのまま確率になるのがポイントです。

  • GAUSS(0) = 0(中央ぴったりなので面積なし)
  • GAUSS(1) ≒ 0.3413(平均から1σの間に約34%のデータ)
  • GAUSS(2) ≒ 0.4772(平均から2σの間に約48%のデータ)

GAUSS関数にできることをまとめると、次のとおりです。

  • 平均から任意のz値までの確率を計算する
  • 両側確率(±zの範囲に入る確率)を求める
  • STANDARDIZE関数と組み合わせて実データの確率を求める

NOTE

GAUSS関数はGoogleスプレッドシートの全バージョンで使えます。ExcelではExcel 2013以降で対応しています。

GAUSS関数の書き方(構文と引数)

基本構文

=GAUSS(z)

カッコの中に、標準正規分布のz値を指定します。z値とは「平均からの標準偏差の数」のことです。

引数の説明

引数必須/任意説明
z必須標準正規分布における平均からの標準偏差の数(z値)

引数は1つだけで、とてもシンプルです。正の数を指定すると正の値、負の数を指定すると負の値を返します。これを「反対称性」といいます。GAUSS(-z) = -GAUSS(z) という関係が成り立ちます。

数値以外の値(文字列など)を指定すると、#VALUE! エラーになります。

TIP

z値の求め方がわからない場合は、STANDARDIZE関数の使い方を先に確認しておくとスムーズです。

GAUSS関数の基本的な使い方

実際にGAUSS関数を使ってみましょう。A列にz値を入力し、B列で確率を求めます。

A2からA8に次の値が入っているとします。

 A列(z値)B列(GAUSS(z))意味
2行目-3-0.4987平均より左側に49.87%
3行目-2-0.4772平均より左側に47.72%
4行目-1-0.3413平均より左側に34.13%
5行目00平均ぴったり(面積なし)
6行目10.3413平均から右に34.13%
7行目20.4772平均から右に47.72%
8行目30.4987平均から右に49.87%

B2セルに次の数式を入力します。

=GAUSS(A2)

B2をB8までコピーすると、各z値に対する確率が一覧できます。z = 0 のとき 0 になり、z が大きくなるほど 0.5 に近づいていくのがわかりますね。

両側確率を求める

「平均 ± 2σ の範囲にデータの何%が入るか」のように、両側の確率を求めたいときは GAUSS(z) * 2 を使います。

=GAUSS(A2)*2

これは品質管理でよく使う「3σルール」の確認に便利です。

範囲数式結果意味
±1σ=GAUSS(1)*268.27%データの約7割
±2σ=GAUSS(2)*295.45%データの約95%
±3σ=GAUSS(3)*299.73%ほぼ全データ

実務で使えるGAUSS関数の活用例

テストの成績が上位何%かを調べる

「ある社員のテスト結果が、全体の上位何%に入るか」を求めてみましょう。テストの平均点が60点、標準偏差が10点とします。対象の社員は75点でした。

まず、75点をz値に変換する必要があります。ここでSTANDARDIZE関数を使います。

平均点はB1セル(60)、標準偏差はB2セル(10)、対象の点数はB3セル(75)に入っているとします。

ステップ1: z値を確認する

=STANDARDIZE(B3,B1,B2)

結果は 1.5 です。平均から標準偏差1.5個分、上に離れています。

ステップ2: 平均から75点までの確率を求める

GAUSS関数とSTANDARDIZE関数を組み合わせます。1つの数式にまとめると次のとおりです。

=GAUSS(STANDARDIZE(B3,B1,B2))

結果は約 0.4332 です。平均から75点までの間に、全体の約43.32%のデータがあります。

ステップ3: 上位何%かを計算する

75点以上の割合を求めるには、0.5からGAUSS関数の結果を引きます。標準正規分布の右半分(50%)から、平均から75点までの面積(43.32%)を引いた残りが答えです。

=0.5-GAUSS(STANDARDIZE(B3,B1,B2))

結果は約 0.0668、つまり上位約6.68%です。この社員はかなり上位の成績だとわかりますね。

TIP

AVERAGE関数で平均を、STDEV関数で標準偏差を求めれば、テストデータから直接計算できます。

NORMSDIST関数との違いと使い分け

GAUSS関数とよく似た関数にNORMSDIST関数があります。どちらも標準正規分布を扱いますが、「どこからどこまでの確率を返すか」が違います。

比較項目GAUSS(z)NORMSDIST(z)
返す確率の範囲平均(0)からzまで-∞からzまで
z=0のとき00.5
z=2のとき0.47720.9772
負のzの扱い負の値を返す正の値を返す
変換式GAUSS(z) = NORMSDIST(z) – 0.5NORMSDIST(z) = GAUSS(z) + 0.5

使い分けのポイントは次のとおりです。

  • 平均を中心にした範囲の確率 → GAUSS関数が直感的
  • ある値以下になる確率 → NORMSDIST関数
  • 両側の確率 → GAUSS関数が便利(GAUSS(z)*2 だけで求まる)

どちらを使っても結果は変換できます。数式の意味が読みやすいほうを選べば大丈夫です。

また、PHI関数との混同にも注意しましょう。PHI関数は「曲線の高さ(確率密度)」を返す関数です。確率(面積)を返すGAUSS関数とは役割がまったく違います。

関数返す値使いどころ
GAUSS面積(確率)「平均からzσの範囲に何%のデータがある?」
PHI曲線の高さ(密度)「正規分布のグラフを描きたい」
NORMSDIST累積確率(-∞からz)「z以下になる確率は?」

まとめ

GAUSS関数は、標準正規分布の平均からz値までの確率を求める関数です。

  • 構文は =GAUSS(z) で引数は1つだけ
  • 平均からの確率(面積)を返すので、そのまま確率として使える
  • 両側確率は =GAUSS(z)*2 で求まる(3σルールの確認に便利)
  • STANDARDIZE関数と組み合わせれば、実データの確率分析もできる
  • NORMSDIST関数との関係は GAUSS(z) = NORMSDIST(z) - 0.5

テストの成績分析や品質管理で「データが平均からどれくらいの範囲に収まるか」を調べたいとき、ぜひ活用してみてください。

統計系の関数をもっと知りたい方は、PHI関数STANDARDIZE関数の記事もチェックしてみてください。AVERAGE関数STDEV関数の記事もあわせてどうぞ。

タイトルとURLをコピーしました