「クラス全員のテスト結果のばらつきを出したいけど、STDEV関数でいいのかな?」。こんな疑問を感じたことはありませんか?
データが全員分そろっているなら、STDEV関数ではなくSTDEV.P関数を使うのが正解です。計算方法が違うので、使い分けを間違えると結果がずれてしまいます。
この記事ではSTDEV.P関数の基本から実務活用まで解説します。STDEV関数との違いも比較表で整理しました。
STDEV.P関数とは?母集団の標準偏差を求める関数
STDEV.P関数(読み方: エスティーデブ・ピー関数)は、データの母標準偏差を返す関数です。「STDEV」は「Standard Deviation(標準偏差)」、「P」は「Population(母集団)」の略です。
母標準偏差とは、データ全体のばらつきを数値化した指標です。値が大きいほどデータのばらつきが大きくなります。逆に値が小さいほど、データが平均値の近くに集まっています。
たとえば、クラス30人全員のテスト結果があるとします。全員分のデータがそろっているので「母集団」です。この場合はSTDEV.P関数でばらつきを測ります。
STDEV.P関数にできることをまとめると、次のとおりです。
- データ全体のばらつき(母標準偏差)を数値で求める
- 複数のグループのばらつきを比較する
- 品質管理の管理図(平均±2σ、±3σ)に活用する
- AVERAGE関数と組み合わせて「平均±標準偏差」の範囲を求める
NOTE
STDEV.P関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。旧名称のSTDEVP関数とも同じ計算結果になります。
STDEV.P関数の書き方(構文と引数)
基本構文
=STDEV.P(値1, [値2], ...)
カッコの中に、標準偏差を求めたいデータやセル範囲を指定します。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 値1 | 必須 | 標準偏差を求めたい最初の値またはセル範囲 |
| 値2, … | 任意 | 追加の値またはセル範囲。最大255個まで指定可能 |
引数にはセル参照、セル範囲、数値を直接指定できます。
TIP
セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。
「母集団」の標準偏差とは?
STDEV.P関数が返すのは母集団の標準偏差です。ちょっとむずかしく聞こえますが、考え方はシンプルです。
- 母集団: データが全部そろっている場合(例: クラス30人全員のテスト結果)
- 標本: データの一部だけを取り出した場合(例: 社員1,000人のうち100人を抜き出して調査)
手元のデータが「全員分」「全期間分」なら、STDEV.P関数を使います。計算では偏差平方和を「n(データ個数)」で割ります。
データが全体の一部なら、STDEV関数を使います。この違いについては後半の「使い分け」セクションで詳しく説明します。
STDEV.P関数の基本的な使い方
以下の売上データでSTDEV.P関数を使ってみましょう。
B2からB11に営業部10人全員の月間売上データ(万円)が入っているとします。
| A列(担当者) | B列(売上) | |
|---|---|---|
| 2行目 | 田中 | 120 |
| 3行目 | 鈴木 | 85 |
| 4行目 | 佐藤 | 200 |
| 5行目 | 山田 | 150 |
| 6行目 | 高橋 | 95 |
| 7行目 | 伊藤 | 180 |
| 8行目 | 渡辺 | 110 |
| 9行目 | 中村 | 130 |
| 10行目 | 小林 | 160 |
| 11行目 | 加藤 | 140 |
母標準偏差を求める
=STDEV.P(B2:B11)
結果は約 35.5 です。10人全員のデータなので「母集団」として計算されます。各担当者の売上が平均値(137万円)から、平均して約35.5万円離れていることを意味します。
NOTE
同じデータにSTDEV関数を使うと約37.5になります。STDEV.P関数のほうがやや小さい値になるのは、計算方法の違い(nで割るかn-1で割るか)によるものです。
標準偏差の値をどう読むか
標準偏差の値だけでは「大きい」「小さい」の判断がしにくいですよね。比較対象があると意味が出てきます。
たとえば、2つの部署の売上データを比べてみましょう。
| 部署 | 平均売上 | 母標準偏差(STDEV.P) |
|---|---|---|
| 営業1課 | 137万円 | 35.5 |
| 営業2課 | 137万円 | 11.0 |
平均売上は同じでも、営業2課のほうがばらつきが小さいです。営業2課は全員が安定して売上を出しています。
TIP
標準偏差を平均値で割った値を変動係数(CV)と呼びます。
=STDEV.P(B2:B11)/AVERAGE(B2:B11)で求められます。単位が違うデータ同士のばらつきも比較できて便利ですよ。
STDEV.P関数の実践的な使い方・応用例
品質管理で使う(平均±2σの管理範囲)
製造業の品質管理では「平均±2σ(シグマ)」の範囲をよく使います。σは標準偏差のことです。この範囲から外れたデータは「異常値」として調査対象になります。
全製品の検査データがB2:B101に入っているとします。
=AVERAGE(B2:B101) - 2*STDEV.P(B2:B101)
=AVERAGE(B2:B101) + 2*STDEV.P(B2:B101)
データの約95%がこの範囲に収まります。範囲外のデータは工程に問題がある可能性があります。
TIP
品質管理の管理図では、全検査データを使うため「母集団」として扱います。そのためSTDEV関数ではなくSTDEV.P関数を使うのが正しい選択です。
条件付き書式で外れ値を強調する
平均から標準偏差の2倍以上離れたデータを自動的にハイライトすると便利です。
- B2:B101を選択する
- 「表示形式」→「条件付き書式」を開く
- 「カスタム数式」を選び、以下の数式を入力する
上限を超えるデータを赤にする場合:
=B2 > AVERAGE($B$2:$B$101) + 2*STDEV.P($B$2:$B$101)
下限を下回るデータも赤にする場合:
=B2 < AVERAGE($B$2:$B$101) - 2*STDEV.P($B$2:$B$101)
これで異常値が自動で色付けされます。
全社員のテスト結果で偏差値を計算する
全社員のスキルテスト結果から偏差値を求めてみましょう。偏差値は「平均を50、標準偏差を10」に換算した指標です。
全社員の得点がB2:B51に入っているとします。
=50 + 10 * (B2 - AVERAGE($B$2:$B$51)) / STDEV.P($B$2:$B$51)
全社員のデータなので、STDEV.P関数を使うのが適切です。自分の位置を直感的に把握できますよ。
TIP
STDEV.P関数の結果が0だとゼロ除算エラーになります。全員が同じ点数の場合(ばらつきがない場合)は偏差値を計算できません。IFERROR関数で囲んでおくと安心です。
よくあるエラーと対処法
#DIV/0!エラー
STDEV.P関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| 範囲内に数値データがない | 文字列ばかりの範囲を指定していないか確認する |
| 数値データが0個 | 1個以上の数値データを指定する |
NOTE
STDEV関数は最低2個の数値が必要ですが、STDEV.P関数は1個でも計算できます(結果は0になります)。0個の場合にのみ#DIV/0!エラーが発生します。
#VALUE!エラー
引数に文字列を直接入力すると発生します。
=STDEV.P("100", "200") → #VALUE!エラー
=STDEV.P(100, 200) → 正常に計算される
セル範囲内に文字列がある場合は自動で無視されます。文字列を直接引数として渡した場合にのみ発生するエラーです。
結果が0になるケース
すべてのデータが同じ値の場合、標準偏差は0になります。これはエラーではなく「ばらつきがまったくない」という正しい結果です。
TIP
期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。STDEV.P関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。COUNT関数で数値の個数を確認するのがおすすめです。
STDEV関数との違い・使い分け
STDEV関数とSTDEV.P関数の比較表
| 項目 | STDEV | STDEV.P |
|---|---|---|
| 正式名称 | 標本標準偏差 | 母集団の標準偏差 |
| 計算で割る数 | n – 1 | n |
| 使う場面 | データが全体の一部のとき | データが全部そろっているとき |
| 結果 | やや大きくなる | やや小さくなる |
| 最低データ数 | 2個 | 1個 |
| 旧名称 | STDEV.S | STDEVP |
同じデータでもSTDEV関数のほうが値がやや大きくなります。STDEV関数はn-1で割ることで「全体のばらつきをより正確に推定する」補正をかけているためです。
どちらを使えばいいか迷ったら
以下の基準で判断してください。
- STDEV.P関数を使う場面: クラス全員のテスト結果、全社員の売上データ、全店舗の月間売上、全製品の検査データ
- STDEV関数を使う場面: アンケート結果(回答者は全体の一部)、サンプル検査、一部の顧客データの分析
迷ったらSTDEV関数を選んでおけば安全です。n-1で割るほうが推定値として保守的になるため、判断を誤るリスクが低くなります。
NOTE
データ件数が30を超えると、STDEV関数とSTDEV.P関数の差はほとんどなくなります。どちらを使っても実務上の問題はありません。
VAR.P関数との関係
VAR.P関数は母分散を返す関数です。母分散と母標準偏差の関係は以下のとおりです。
- 母分散 = 母標準偏差の2乗
- 母標準偏差 = 母分散の平方根
つまり =STDEV.P(B2:B11) と =SQRT(VAR.P(B2:B11)) は同じ結果になります。
| 関数 | 返す値 | 単位 |
|---|---|---|
| VAR.P | 母分散 | 元データの2乗 |
| STDEV.P | 母標準偏差 | 元データと同じ |
標準偏差のほうが「元データと同じ単位」なので直感的に理解しやすいです。実務ではSTDEV.P関数(母標準偏差)を使うのが一般的です。
関連関数の一覧
| 関数 | 説明 | 計算方法 |
|---|---|---|
| STDEV | 標本標準偏差 | n-1で割る |
| STDEV.S | STDEVと同じ(新名称) | n-1で割る |
| STDEV.P | 母集団の標準偏差 | nで割る |
| STDEVP | STDEV.Pの旧名称 | nで割る |
| VAR | 標本分散 | n-1で割る |
| VAR.P | 母分散 | nで割る |
まとめ
STDEV.P関数は、データの母集団の標準偏差を返す関数です。
この記事のポイント
- 構文は
=STDEV.P(値1, [値2], ...)で、セル範囲を指定するだけ - 母標準偏差はデータ全体のばらつきを数値化した指標
- データが「全部そろっている」→ STDEV.P関数、「全体の一部」→ STDEV関数
- 品質管理の管理図(平均±2σ)に最適
- VAR.P関数(母分散)の平方根 = STDEV.P関数(母標準偏差)
次のステップ:関連する統計関数
STDEV.P関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。
