「正規分布のグラフを作りたいけど、曲線のデータってどうやって用意すればいいんだろう?」。こんな疑問を感じたことはありませんか?
品質管理や成績分析で正規分布の形を可視化したい場面は意外と多いですよね。そこで使えるのがPHI関数です。標準正規分布の「曲線の高さ」を一発で返してくれます。
この記事ではPHI関数の基本的な使い方から、正規分布曲線の作成や似た関数との使い分けまで解説します。
PHI関数とは?標準正規分布の密度関数値を求める関数
PHI関数(読み方: ファイ関数)は、標準正規分布の確率密度関数の値を求める関数です。「PHI」はギリシャ文字の「φ(ファイ)」に由来し、統計学で標準正規分布の密度関数を表す記号として使われています。
ちょっとむずかしく聞こえますが、やっていることはシンプルです。標準正規分布とは、あの釣り鐘型のグラフのことです。PHI関数は、そのグラフ上の「特定の位置での曲線の高さ」を返します。
- x = 0 のとき最大値(約0.3989)を返す
- xが0から離れるほど値は小さくなる
- 左右対称なので、PHI(-1) と PHI(1) は同じ値になる
PHI関数にできることをまとめると、次のとおりです。
- 標準正規分布の確率密度関数の値を計算する
- 正規分布曲線のグラフ用データを作成する
- データの分布の「山の高さ」を確認する
NOTE
PHI関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。
PHI関数の書き方(構文と引数)
基本構文
=PHI(x)
カッコの中に、密度関数値を求めたい数値を指定します。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| x | 必須 | 標準正規分布の密度を求める数値 |
引数は1つだけで、とてもシンプルです。正の数でも負の数でも指定できます。
TIP
PHI関数が内部で計算している式は
(1/√(2π)) × e^(-x²/2)です。手計算だと面倒ですが、関数を使えば一発で求まります。EXP関数を使って手動で計算することもできますが、PHI関数のほうが圧倒的にラクです。
PHI関数の基本的な使い方
実際にPHI関数を使ってみましょう。A列にxの値を入力し、B列で密度関数値を求めます。
A2からA6に次の値が入っているとします。
| A列(x) | B列(PHI(x)) | |
|---|---|---|
| 2行目 | -2 | 0.0540 |
| 3行目 | -1 | 0.2420 |
| 4行目 | 0 | 0.3989 |
| 5行目 | 1 | 0.2420 |
| 6行目 | 2 | 0.0540 |
密度関数値を求める
B2セルに次の数式を入力します。
=PHI(A2)
A2が「-2」なので、結果は約 0.0540 です。釣り鐘型の端のほうなので、値が小さいですね。
B2をB6までコピーすると、各xの値に対する密度関数値が一覧できます。x = 0 のとき最大値の約 0.3989 になり、0から離れるほど値が小さくなるのがわかります。
結果の見方のポイント
ここで大切なのが、PHI関数が返す値は「確率」ではないという点です。返されるのは「確率密度」で、グラフの曲線の高さを表します。
「ある値以下になる確率」を求めたい場合は、NORMDIST関数を使います。この違いは後ほど詳しく説明します。
PHI関数の実務活用パターン
正規分布曲線のグラフ用データを作成する
品質管理や成績分析で、正規分布の曲線をグラフにしたい場面は多いですよね。PHI関数を使えば、グラフ用のデータを簡単に作成できます。
A列にxの値を -3 から 3 まで 0.5 刻みで入力します。
A2セルに「-3」と入力し、A3セルに次の数式を入力します。
=-3+0.5*(ROW()-2)
A3をA14までコピーすると、-3 から 3 まで0.5刻みの値が並びます。
B2セルに次の数式を入力します。
=PHI(A2)
B2をB14までコピーすれば、正規分布曲線のy座標データが完成です。このA列とB列を選択してグラフを挿入すれば、きれいな釣り鐘型の曲線が描けます。
実データの分布を標準正規分布と比較する
営業チームの月間売上データが正規分布に近いかどうかを視覚的に確認してみましょう。
まず、実データをSTANDARDIZE関数でzスコアに変換します。次に、そのzスコアに対するPHI関数の値を求めれば、理論上の正規分布曲線と実データの分布を重ねて比較できます。
たとえば、ある社員のzスコアが1.5だった場合のPHI関数の値を確認してみます。
=PHI(1.5)
結果は約 0.1295 です。中心(0.3989)と比べるとかなり低い値ですね。この社員の成績は平均からかなり離れた位置にあることがわかります。
よくあるエラーと対処法
PHI関数はシンプルなので、エラーになるケースは限られます。
| エラー | 原因 | 対処法 |
|---|---|---|
| #VALUE! | 引数に文字列を指定した | 数値またはセル参照を指定する |
| #VALUE! | 引数が空白のセルを参照している | 数値が入ったセルを参照する |
数値を正しく指定すれば、エラーになることはほとんどありません。負の数や小数も問題なく処理できます。
TIP
引数にセル参照を使う場合は、参照先に数値が入っているか確認しましょう。テキスト形式で入力された数字(見た目は数値でも実は文字列)が原因で #VALUE! になるケースがあります。
似た関数との違い・使い分け
正規分布に関連する関数はいくつかあります。それぞれの役割を整理しておきましょう。
| 関数 | 返す値 | 用途 |
|---|---|---|
| PHI | 確率密度(曲線の高さ) | グラフ描画、分布の形の確認 |
| NORMDIST(第4引数FALSE) | 確率密度(任意の平均・標準偏差) | 標準正規分布以外の密度計算 |
| NORMDIST(第4引数TRUE) | 累積確率(ある値以下の確率) | 「○点以下の割合は何%?」の計算 |
| STANDARDIZE | zスコア | データを標準化して比較する |
使い分けのポイントは次のとおりです。
- 曲線の高さ(密度)が知りたい → PHI関数(標準正規分布の場合)
- ある値以下になる確率が知りたい → NORMDIST関数(第4引数をTRUEに)
- データを標準化したい → STANDARDIZE関数
PHI関数は =NORMDIST(x, 0, 1, FALSE) と同じ結果を返します。標準正規分布(平均0・標準偏差1)に限定した場面では、PHI関数のほうが式が短くて見やすいですね。
平均や標準偏差が0と1以外の場合は、NORMDIST関数を使ってください。
まとめ
PHI関数は、標準正規分布の確率密度関数の値を求める関数です。
- 構文は
=PHI(x)で引数は1つだけ - 返すのは「確率密度」(曲線の高さ)であり「確率」ではない
- x = 0 で最大値(約0.3989)、離れるほど小さくなる
- 正規分布曲線のグラフ用データ作成に便利
=NORMDIST(x, 0, 1, FALSE)と同じ結果だが、PHI関数のほうがシンプル
正規分布の曲線を描きたいときや、データの分布を確認したいときにぜひ活用してみてください。
統計系の関数をもっと知りたい方は、AVERAGE関数やSTDEV関数、SKEW関数、KURT関数の記事もあわせてチェックしてみてください。
