「売上データのばらつきを数字で把握したいけど、どの関数を使えばいいんだろう?」。こんな疑問を感じたことはありませんか?
平均値だけでは、データがどれくらい散らばっているかが見えません。ばらつきを数値化できれば、チーム間の比較やデータの安定度の評価に使えます。
そんなときに使うのがVAR関数です。この記事では基本の書き方から実務での活用例まで解説します。VAR.P関数との違いやSTDEV関数との関係もあわせて整理しました。
VAR関数とは?標本分散を求める関数
VAR関数(読み方: バー関数)は、データの標本分散を返す関数です。「VAR」は「Variance(分散)」の略です。
分散とは、データが平均値からどれくらい離れているかを数値化した指標です。値が大きいほどデータのばらつきが大きくなります。値が0なら、すべてのデータが同じ値ということです。
身近な例でいえば、テストの平均点が同じ70点のクラスが2つあるとします。全員が65〜75点に収まっているクラスと、30〜100点までバラバラのクラスでは意味が違いますよね。この「ばらつきの大きさ」を数値で表すのがVAR関数です。
VAR関数にできることをまとめると、次のとおりです。
- データのばらつき(標本分散)を数値で求める
- 複数のデータ群のばらつきを比較する
- 品質管理やテスト結果の分析に活用する
- AVERAGE関数と組み合わせてデータの散らばり具合を定量化する
NOTE
VAR関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。VAR.S関数とも同じ計算結果になります。
VAR関数の書き方(構文と引数)
基本構文
=VAR(値1, [値2], ...)
カッコの中に、分散を求めたいデータやセル範囲を指定します。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 値1 | 必須 | 分散を求めたい最初の値またはセル範囲 |
| 値2, … | 任意 | 追加の値またはセル範囲。最大255個まで指定可能 |
引数にはセル参照、セル範囲、数値を直接指定できます。
TIP
セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。
「標本」分散とは?
VAR関数が返すのは標本分散です。ちょっとむずかしく聞こえますが、考え方はシンプルです。
- 標本: データの一部だけを取り出した場合(例: 社員1,000人のうち100人を抜き出して調査)
- 母集団: データが全部そろっている場合(例: クラス30人全員のテスト結果)
手元のデータが「全体の一部」なら、VAR関数を使います。計算では「n-1」で割ることで、全体のばらつきをより正確に推定します。
データが全員分そろっているなら、VAR.P関数を使います。この違いについては後半の「使い分け」セクションで詳しく説明します。
VAR関数の基本的な使い方
以下の売上データでVAR関数を使ってみましょう。
B2からB11に10人分の月間売上データ(万円)が入っているとします。
| A列(担当者) | B列(売上) | |
|---|---|---|
| 2行目 | 田中 | 120 |
| 3行目 | 鈴木 | 85 |
| 4行目 | 佐藤 | 200 |
| 5行目 | 山田 | 150 |
| 6行目 | 高橋 | 95 |
| 7行目 | 伊藤 | 180 |
| 8行目 | 渡辺 | 110 |
| 9行目 | 中村 | 130 |
| 10行目 | 小林 | 160 |
| 11行目 | 加藤 | 140 |
分散を求める
=VAR(B2:B11)
結果は約 1,406.25 です。この値は各担当者の売上が平均値(137万円)からどれくらい離れているかを表しています。
分散の値をどう読むか
分散の値だけでは「大きい」「小さい」の判断がしにくいですよね。比較対象があると意味が出てきます。
たとえば、2つのチームの売上データを比べてみましょう。
| チーム | 平均売上 | 分散 |
|---|---|---|
| Aチーム | 137万円 | 1,406.25 |
| Bチーム | 137万円 | 144.00 |
平均売上は同じでも、Aチームの分散はBチームの約10倍です。Aチームのほうが売上のばらつきが大きいことがわかります。
TIP
分散の単位は「元データの2乗」になります。売上(万円)の分散は「万円の2乗」です。直感的にわかりにくいと感じたら、STDEV関数で標準偏差に変換しましょう。標準偏差は元データと同じ単位(万円)です。
VAR関数の実践的な使い方・応用例
データのばらつきを比較する
分散は「ばらつきの大きさ」を表す数値なので、複数のデータ群を比較するのに使えます。
たとえば、3チームの売上の安定度を比較してみましょう。
=VAR(B2:B11)
=VAR(C2:C11)
=VAR(D2:D11)
分散が小さいチームほど安定しています。ただし、平均値が異なるチームを比較する場合は注意が必要です。
平均値が違うと分散の大小だけでは公平に比較できません。その場合は変動係数(CV)を使います。
=STDEV(B2:B11)/AVERAGE(B2:B11)
変動係数は「平均値に対するばらつきの割合」です。単位やスケールが違うデータ同士の比較にも使えます。
分散を使って外れ値を検出する
平均から大きく離れたデータ(外れ値)を検出するのにも分散は役立ちます。
「平均 +/- 標準偏差の2倍」の範囲から外れるデータを検出する数式です。
=IF(ABS(B2-AVERAGE($B$2:$B$11))>2*STDEV($B$2:$B$11), "外れ値", "")
この数式をB2と同じ行のC列に入れて下方向にコピーすれば、外れ値に「外れ値」と表示されます。
TIP
外れ値の検出には分散そのものよりも、標準偏差(分散の平方根)を使うのが一般的です。
=SQRT(VAR(B2:B11))と=STDEV(B2:B11)は同じ結果になります。
偏差平方和を求める
分散に「データ個数 – 1」を掛けると、偏差平方和が求まります。偏差平方和は回帰分析や分散分析の基礎になる値です。
=VAR(B2:B11) * (COUNT(B2:B11) - 1)
COUNT関数でデータ個数を数え、そこから1を引いた値を掛けています。
よくあるエラーと対処法
#DIV/0!エラー
VAR関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| 数値データが1個しかない | 2個以上の数値データを指定する |
| 範囲内に数値が含まれていない | 文字列ばかりの範囲を指定していないか確認する |
分散を計算するには最低2個の数値が必要です。1個しかないと「ばらつき」を求められないためエラーになります。
#VALUE!エラー
引数に文字列を直接入力すると発生します。
=VAR("100", "200") → #VALUE!エラー
=VAR(100, 200) → 正常に計算される
セル範囲内に文字列がある場合は自動で無視されます。文字列を直接引数として渡した場合にのみ発生するエラーです。
結果が0になるケース
すべてのデータが同じ値の場合、分散は0になります。これはエラーではなく「ばらつきがまったくない」という正しい結果です。
TIP
期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。VAR関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。COUNT関数で数値の個数を確認するのがおすすめです。
VAR.P関数・STDEV関数との違い・使い分け
VAR関数とVAR.P関数の違い
VAR関数とVAR.P関数は、どちらも分散を求める関数ですが、計算方法が異なります。
| 項目 | VAR | VAR.P |
|---|---|---|
| 正式名称 | 標本分散 | 母集団の分散 |
| 割る数 | n – 1 | n |
| 使う場面 | データが全体の一部のとき | データが全部そろっているとき |
| 結果 | やや大きくなる | やや小さくなる |
同じデータでもVAR関数のほうが値がやや大きくなります。これは「全体のばらつきをより正確に推定する」ための補正です。
どちらを使えばいいか迷ったら
以下の基準で判断してください。
- VAR関数を使う場面: アンケート結果(回答者は全体の一部)、サンプル検査、一部の顧客データの分析
- VAR.P関数を使う場面: クラス全員のテスト結果、全社員の売上データ、全店舗の月間売上
迷ったらVAR関数を選んでおけば安全です。n-1で割るほうが推定値として保守的(やや大きめ)になるため、判断を誤るリスクが低くなります。
NOTE
データ件数が30を超えると、VAR関数とVAR.P関数の差はほとんどなくなります。どちらを使っても実務上の問題はありません。
STDEV関数との関係
STDEV関数は標準偏差(標本標準偏差)を返す関数です。分散と標準偏差の関係は以下のとおりです。
- 分散 = 標準偏差の2乗
- 標準偏差 = 分散の平方根
つまり =VAR(B2:B11) と =STDEV(B2:B11)^2 は同じ結果になります。
| 関数 | 返す値 | 単位 |
|---|---|---|
| VAR | 分散(標本分散) | 元データの2乗 |
| STDEV | 標準偏差(標本標準偏差) | 元データと同じ |
分散は「2乗単位」なので直感的に解釈しにくいです。たとえば売上データ(万円)の分散は「万円の2乗」です。一方、標準偏差は「万円」で表せます。
実務ではSTDEV関数(標準偏差)のほうが使われる場面が多いです。ただし、分散は統計計算の中間値として重要です。分散分析やポートフォリオのリスク計算など、分散が直接必要になる場面もあります。
関連関数の一覧
| 関数 | 説明 | 計算方法 |
|---|---|---|
| VAR | 標本分散 | n-1で割る |
| VAR.S | VARと同じ(新名称) | n-1で割る |
| VAR.P | 母集団の分散 | nで割る |
| VARP | VAR.Pの旧名称 | nで割る |
| STDEV | 標本標準偏差 | n-1で割る |
| STDEV.P | 母集団の標準偏差 | nで割る |
まとめ
VAR関数は、データの標本分散を返す関数です。
この記事のポイント
- 構文は
=VAR(値1, [値2], ...)で、セル範囲を指定するだけ - 分散はデータのばらつきを数値化した指標。値が大きいほどばらつきが大きい
- 分散の単位は「元データの2乗」。直感的に読みたいなら標準偏差(STDEV関数)を使う
- データが「全体の一部」→ VAR関数、「全部そろっている」→ VAR.P関数
- STDEV関数(標準偏差)の2乗 = VAR関数(分散)
- 迷ったらVAR関数を選んでおけば安全
次のステップ:関連する統計関数
VAR関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。
