「全社員の売上データのばらつきを数字で出したいけど、VAR関数とVAR.P関数、どっちを使えばいいんだろう?」。こんな疑問を感じたことはありませんか?
データが全員分そろっているなら、VAR関数ではなくVAR.P関数を使うのが正解です。計算方法が違うので、使い分けを間違えると結果がずれてしまいます。
この記事ではVAR.P関数の基本から実務活用まで解説します。VAR関数との違いも比較表で整理しました。
VAR.P関数とは?母集団の分散を求める関数
VAR.P関数(読み方: バー・ピー関数)は、データの母分散を返す関数です。「VAR」は「Variance(分散)」、「P」は「Population(母集団)」の略です。
母分散とは、データ全体のばらつきを数値化した指標です。値が大きいほどデータのばらつきが大きくなります。値が0なら、すべてのデータが同じ値ということです。
たとえば、クラス30人全員のテスト結果があるとします。全員分のデータがそろっているので「母集団」です。この場合はVAR.P関数でばらつきを測ります。
VAR.P関数にできることをまとめると、次のとおりです。
- データ全体のばらつき(母分散)を数値で求める
- 複数のグループのばらつきを比較する
- 品質管理やテスト結果の分析に活用する
- AVERAGE関数と組み合わせてデータの散らばり具合を定量化する
NOTE
VAR.P関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。旧名称のVARP関数とも同じ計算結果になります。
VAR.P関数の書き方(構文と引数)
基本構文
=VAR.P(値1, [値2], ...)
カッコの中に、分散を求めたいデータやセル範囲を指定します。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 値1 | 必須 | 分散を求めたい最初の値またはセル範囲 |
| 値2, … | 任意 | 追加の値またはセル範囲。最大255個まで指定可能 |
引数にはセル参照、セル範囲、数値を直接指定できます。
TIP
セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。
「母集団」の分散とは?
VAR.P関数が返すのは母集団の分散です。ちょっとむずかしく聞こえますが、考え方はシンプルです。
- 母集団: データが全部そろっている場合(例: クラス30人全員のテスト結果)
- 標本: データの一部だけを取り出した場合(例: 社員1,000人のうち100人を抜き出して調査)
手元のデータが「全員分」「全期間分」なら、VAR.P関数を使います。計算では偏差平方和を「n(データ個数)」で割ります。
データが全体の一部なら、VAR関数を使います。この違いについては後半の「使い分け」セクションで詳しく説明します。
VAR.P関数の基本的な使い方
以下の売上データでVAR.P関数を使ってみましょう。
B2からB11に営業部10人全員の月間売上データ(万円)が入っているとします。
| A列(担当者) | B列(売上) | |
|---|---|---|
| 2行目 | 田中 | 120 |
| 3行目 | 鈴木 | 85 |
| 4行目 | 佐藤 | 200 |
| 5行目 | 山田 | 150 |
| 6行目 | 高橋 | 95 |
| 7行目 | 伊藤 | 180 |
| 8行目 | 渡辺 | 110 |
| 9行目 | 中村 | 130 |
| 10行目 | 小林 | 160 |
| 11行目 | 加藤 | 140 |
母分散を求める
=VAR.P(B2:B11)
結果は約 1,265.63 です。10人全員のデータなので「母集団」として計算されます。各担当者の売上が平均値(137万円)からどれくらい離れているかを表しています。
NOTE
同じデータにVAR関数を使うと約1,406.25になります。VAR.P関数のほうがやや小さい値になるのは、計算方法の違い(nで割るかn-1で割るか)によるものです。
分散の値をどう読むか
分散の値だけでは「大きい」「小さい」の判断がしにくいですよね。比較対象があると意味が出てきます。
たとえば、2つの部署の売上データを比べてみましょう。
| 部署 | 平均売上 | 母分散(VAR.P) |
|---|---|---|
| 営業1課 | 137万円 | 1,265.63 |
| 営業2課 | 137万円 | 121.00 |
平均売上は同じでも、営業1課の分散は営業2課の約10倍です。営業1課のほうが売上のばらつきが大きいことがわかります。
TIP
分散の単位は「元データの2乗」になります。売上(万円)の分散は「万円の2乗」です。直感的にわかりにくいと感じたら、STDEV.P関数で母標準偏差に変換しましょう。標準偏差は元データと同じ単位(万円)です。
VAR.P関数の実践的な使い方・応用例
データのばらつきを比較する
分散は「ばらつきの大きさ」を表す数値なので、複数のデータ群を比較するのに使えます。
たとえば、3つの店舗の日次売上の安定度を比較してみましょう。全営業日のデータがそろっているので、母分散を使います。
=VAR.P(B2:B31)
=VAR.P(C2:C31)
=VAR.P(D2:D31)
分散が小さい店舗ほど安定しています。ただし、平均値が異なる店舗を比較する場合は注意が必要です。
平均値が違うと分散の大小だけでは公平に比較できません。その場合は変動係数(CV)を使います。
=STDEV.P(B2:B31)/AVERAGE(B2:B31)
変動係数は「平均値に対するばらつきの割合」です。単位やスケールが違うデータ同士の比較にも使えます。
品質管理で使う(管理範囲の算出)
全製品の検査データがそろっている場合、母分散から管理範囲を算出できます。B2:B101に全製品の検査データが入っているとします。
=AVERAGE(B2:B101) - 2*SQRT(VAR.P(B2:B101))
=AVERAGE(B2:B101) + 2*SQRT(VAR.P(B2:B101))
SQRT関数で分散を標準偏差に変換してから計算しています。「平均+-2sigma」の範囲にデータの約95%が収まります。
TIP
標準偏差を直接求めるなら、
=SQRT(VAR.P(B2:B101))の代わりに STDEV.P関数 を使うほうが簡単です。品質管理では母集団として扱うので、STDEV関数ではなくSTDEV.P関数を選んでください。
偏差平方和を求める
分散に「データ個数」を掛けると、偏差平方和が求まります。偏差平方和は回帰分析や分散分析の基礎になる値です。
=VAR.P(B2:B11) * COUNT(B2:B11)
COUNT関数でデータ個数を数え、そのまま掛けています。VAR関数(標本分散)の場合は「n-1」を掛けますが、VAR.P関数は「n」で割っているので「n」を掛ければ元に戻ります。
よくあるエラーと対処法
#DIV/0!エラー
VAR.P関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| 範囲内に数値データがない | 文字列ばかりの範囲を指定していないか確認する |
| 数値データが0個 | 1個以上の数値データを指定する |
NOTE
VAR関数は最低2個の数値が必要ですが、VAR.P関数は1個でも計算できます(結果は0になります)。0個の場合にのみ#DIV/0!エラーが発生します。
#VALUE!エラー
引数に文字列を直接入力すると発生します。
=VAR.P("100", "200") → #VALUE!エラー
=VAR.P(100, 200) → 正常に計算される
セル範囲内に文字列がある場合は自動で無視されます。文字列を直接引数として渡した場合にのみ発生するエラーです。
結果が0になるケース
すべてのデータが同じ値の場合、分散は0になります。これはエラーではなく「ばらつきがまったくない」という正しい結果です。
TIP
期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。VAR.P関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。COUNT関数で数値の個数を確認するのがおすすめです。
VAR関数・STDEV.P関数との違い・使い分け
VAR.P関数とVAR関数の比較表
VAR.P関数とVAR関数は、どちらも分散を求める関数ですが、計算方法が異なります。
| 項目 | VAR.P | VAR |
|---|---|---|
| 正式名称 | 母集団の分散 | 標本分散 |
| 計算で割る数 | n | n – 1 |
| 使う場面 | データが全部そろっているとき | データが全体の一部のとき |
| 結果 | やや小さくなる | やや大きくなる |
| 最低データ数 | 1個 | 2個 |
| 旧名称 | VARP | VAR.S |
同じデータでもVAR関数のほうが値がやや大きくなります。VAR関数はn-1で割ることで「全体のばらつきをより正確に推定する」補正をかけているためです。
どちらを使えばいいか迷ったら
以下の基準で判断してください。
- VAR.P関数を使う場面: クラス全員のテスト結果、全社員の売上データ、全店舗の月間売上、全製品の検査データ
- VAR関数を使う場面: アンケート結果(回答者は全体の一部)、サンプル検査、一部の顧客データの分析
迷ったらVAR関数を選んでおけば安全です。n-1で割るほうが推定値として保守的になるため、判断を誤るリスクが低くなります。
NOTE
データ件数が30を超えると、VAR関数とVAR.P関数の差はほとんどなくなります。どちらを使っても実務上の問題はありません。
STDEV.P関数との関係
STDEV.P関数は母標準偏差を返す関数です。母分散と母標準偏差の関係は以下のとおりです。
- 母分散 = 母標準偏差の2乗
- 母標準偏差 = 母分散の平方根
つまり =VAR.P(B2:B11) と =STDEV.P(B2:B11)^2 は同じ結果になります。
| 関数 | 返す値 | 単位 |
|---|---|---|
| VAR.P | 母分散 | 元データの2乗 |
| STDEV.P | 母標準偏差 | 元データと同じ |
分散は「2乗単位」なので直感的に解釈しにくいです。たとえば売上データ(万円)の分散は「万円の2乗」です。一方、標準偏差は「万円」で表せます。
実務ではSTDEV.P関数(母標準偏差)のほうが使われる場面が多いです。ただし、分散は統計計算の中間値として重要です。分散分析やポートフォリオのリスク計算など、分散が直接必要になる場面もあります。
関連関数の一覧
| 関数 | 説明 | 計算方法 |
|---|---|---|
| VAR.P | 母集団の分散 | nで割る |
| VARP | VAR.Pの旧名称 | nで割る |
| VAR | 標本分散 | n-1で割る |
| VAR.S | VARと同じ(新名称) | n-1で割る |
| STDEV.P | 母集団の標準偏差 | nで割る |
| STDEV | 標本標準偏差 | n-1で割る |
まとめ
VAR.P関数は、データの母集団の分散を返す関数です。
この記事のポイント
- 構文は
=VAR.P(値1, [値2], ...)で、セル範囲を指定するだけ - 母分散はデータ全体のばらつきを数値化した指標
- データが「全部そろっている」→ VAR.P関数、「全体の一部」→ VAR関数
- 分散の単位は「元データの2乗」。直感的に読みたいなら母標準偏差(STDEV.P関数)を使う
- STDEV.P関数(母標準偏差)の2乗 = VAR.P関数(母分散)
次のステップ:関連する統計関数
VAR.P関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。
