スプレッドシートのVAR関数の使い方|標本分散を求める方法

スポンサーリンク

「売上データのばらつきを数字で把握したいけど、どの関数を使えばいいんだろう?」。こんな疑問を感じたことはありませんか?

平均値だけでは、データがどれくらい散らばっているかが見えません。ばらつきを数値化できれば、チーム間の比較やデータの安定度の評価に使えます。

そんなときに使うのがVAR関数です。この記事では基本の書き方から実務での活用例まで解説します。VAR.P関数との違いやSTDEV関数との関係もあわせて整理しました。

VAR関数とは?標本分散を求める関数

VAR関数(読み方: バー関数)は、データの標本分散を返す関数です。「VAR」は「Variance(分散)」の略です。

分散とは、データが平均値からどれくらい離れているかを数値化した指標です。値が大きいほどデータのばらつきが大きくなります。値が0なら、すべてのデータが同じ値ということです。

身近な例でいえば、テストの平均点が同じ70点のクラスが2つあるとします。全員が65〜75点に収まっているクラスと、30〜100点までバラバラのクラスでは意味が違いますよね。この「ばらつきの大きさ」を数値で表すのがVAR関数です。

VAR関数にできることをまとめると、次のとおりです。

  • データのばらつき(標本分散)を数値で求める
  • 複数のデータ群のばらつきを比較する
  • 品質管理やテスト結果の分析に活用する
  • AVERAGE関数と組み合わせてデータの散らばり具合を定量化する

NOTE

VAR関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。VAR.S関数とも同じ計算結果になります。

VAR関数の書き方(構文と引数)

基本構文

=VAR(値1, [値2], ...)

カッコの中に、分散を求めたいデータやセル範囲を指定します。

引数の説明

引数必須/任意説明
値1必須分散を求めたい最初の値またはセル範囲
値2, …任意追加の値またはセル範囲。最大255個まで指定可能

引数にはセル参照、セル範囲、数値を直接指定できます。

TIP

セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。

「標本」分散とは?

VAR関数が返すのは標本分散です。ちょっとむずかしく聞こえますが、考え方はシンプルです。

  • 標本: データの一部だけを取り出した場合(例: 社員1,000人のうち100人を抜き出して調査)
  • 母集団: データが全部そろっている場合(例: クラス30人全員のテスト結果)

手元のデータが「全体の一部」なら、VAR関数を使います。計算では「n-1」で割ることで、全体のばらつきをより正確に推定します。

データが全員分そろっているなら、VAR.P関数を使います。この違いについては後半の「使い分け」セクションで詳しく説明します。

VAR関数の基本的な使い方

以下の売上データでVAR関数を使ってみましょう。

B2からB11に10人分の月間売上データ(万円)が入っているとします。

 A列(担当者)B列(売上)
2行目田中120
3行目鈴木85
4行目佐藤200
5行目山田150
6行目高橋95
7行目伊藤180
8行目渡辺110
9行目中村130
10行目小林160
11行目加藤140

分散を求める

=VAR(B2:B11)

結果は約 1,406.25 です。この値は各担当者の売上が平均値(137万円)からどれくらい離れているかを表しています。

分散の値をどう読むか

分散の値だけでは「大きい」「小さい」の判断がしにくいですよね。比較対象があると意味が出てきます。

たとえば、2つのチームの売上データを比べてみましょう。

チーム平均売上分散
Aチーム137万円1,406.25
Bチーム137万円144.00

平均売上は同じでも、Aチームの分散はBチームの約10倍です。Aチームのほうが売上のばらつきが大きいことがわかります。

TIP

分散の単位は「元データの2乗」になります。売上(万円)の分散は「万円の2乗」です。直感的にわかりにくいと感じたら、STDEV関数で標準偏差に変換しましょう。標準偏差は元データと同じ単位(万円)です。

VAR関数の実践的な使い方・応用例

データのばらつきを比較する

分散は「ばらつきの大きさ」を表す数値なので、複数のデータ群を比較するのに使えます。

たとえば、3チームの売上の安定度を比較してみましょう。

=VAR(B2:B11)
=VAR(C2:C11)
=VAR(D2:D11)

分散が小さいチームほど安定しています。ただし、平均値が異なるチームを比較する場合は注意が必要です。

平均値が違うと分散の大小だけでは公平に比較できません。その場合は変動係数(CV)を使います。

=STDEV(B2:B11)/AVERAGE(B2:B11)

変動係数は「平均値に対するばらつきの割合」です。単位やスケールが違うデータ同士の比較にも使えます。

分散を使って外れ値を検出する

平均から大きく離れたデータ(外れ値)を検出するのにも分散は役立ちます。

「平均 +/- 標準偏差の2倍」の範囲から外れるデータを検出する数式です。

=IF(ABS(B2-AVERAGE($B$2:$B$11))>2*STDEV($B$2:$B$11), "外れ値", "")

この数式をB2と同じ行のC列に入れて下方向にコピーすれば、外れ値に「外れ値」と表示されます。

TIP

外れ値の検出には分散そのものよりも、標準偏差(分散の平方根)を使うのが一般的です。=SQRT(VAR(B2:B11))=STDEV(B2:B11) は同じ結果になります。

偏差平方和を求める

分散に「データ個数 – 1」を掛けると、偏差平方和が求まります。偏差平方和は回帰分析や分散分析の基礎になる値です。

=VAR(B2:B11) * (COUNT(B2:B11) - 1)

COUNT関数でデータ個数を数え、そこから1を引いた値を掛けています。

よくあるエラーと対処法

#DIV/0!エラー

VAR関数で最もよく見るエラーです。以下の原因が考えられます。

原因対策
数値データが1個しかない2個以上の数値データを指定する
範囲内に数値が含まれていない文字列ばかりの範囲を指定していないか確認する

分散を計算するには最低2個の数値が必要です。1個しかないと「ばらつき」を求められないためエラーになります。

#VALUE!エラー

引数に文字列を直接入力すると発生します。

=VAR("100", "200")   → #VALUE!エラー
=VAR(100, 200)        → 正常に計算される

セル範囲内に文字列がある場合は自動で無視されます。文字列を直接引数として渡した場合にのみ発生するエラーです。

結果が0になるケース

すべてのデータが同じ値の場合、分散は0になります。これはエラーではなく「ばらつきがまったくない」という正しい結果です。

TIP

期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。VAR関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。COUNT関数で数値の個数を確認するのがおすすめです。

VAR.P関数・STDEV関数との違い・使い分け

VAR関数とVAR.P関数の違い

VAR関数とVAR.P関数は、どちらも分散を求める関数ですが、計算方法が異なります。

項目VARVAR.P
正式名称標本分散母集団の分散
割る数n – 1n
使う場面データが全体の一部のときデータが全部そろっているとき
結果やや大きくなるやや小さくなる

同じデータでもVAR関数のほうが値がやや大きくなります。これは「全体のばらつきをより正確に推定する」ための補正です。

どちらを使えばいいか迷ったら

以下の基準で判断してください。

  • VAR関数を使う場面: アンケート結果(回答者は全体の一部)、サンプル検査、一部の顧客データの分析
  • VAR.P関数を使う場面: クラス全員のテスト結果、全社員の売上データ、全店舗の月間売上

迷ったらVAR関数を選んでおけば安全です。n-1で割るほうが推定値として保守的(やや大きめ)になるため、判断を誤るリスクが低くなります。

NOTE

データ件数が30を超えると、VAR関数とVAR.P関数の差はほとんどなくなります。どちらを使っても実務上の問題はありません。

STDEV関数との関係

STDEV関数は標準偏差(標本標準偏差)を返す関数です。分散と標準偏差の関係は以下のとおりです。

  • 分散 = 標準偏差の2乗
  • 標準偏差 = 分散の平方根

つまり =VAR(B2:B11)=STDEV(B2:B11)^2 は同じ結果になります。

関数返す値単位
VAR分散(標本分散)元データの2乗
STDEV標準偏差(標本標準偏差)元データと同じ

分散は「2乗単位」なので直感的に解釈しにくいです。たとえば売上データ(万円)の分散は「万円の2乗」です。一方、標準偏差は「万円」で表せます。

実務ではSTDEV関数(標準偏差)のほうが使われる場面が多いです。ただし、分散は統計計算の中間値として重要です。分散分析やポートフォリオのリスク計算など、分散が直接必要になる場面もあります。

関連関数の一覧

関数説明計算方法
VAR標本分散n-1で割る
VAR.SVARと同じ(新名称)n-1で割る
VAR.P母集団の分散nで割る
VARPVAR.Pの旧名称nで割る
STDEV標本標準偏差n-1で割る
STDEV.P母集団の標準偏差nで割る

まとめ

VAR関数は、データの標本分散を返す関数です。

この記事のポイント

  • 構文は =VAR(値1, [値2], ...) で、セル範囲を指定するだけ
  • 分散はデータのばらつきを数値化した指標。値が大きいほどばらつきが大きい
  • 分散の単位は「元データの2乗」。直感的に読みたいなら標準偏差(STDEV関数)を使う
  • データが「全体の一部」→ VAR関数、「全部そろっている」→ VAR.P関数
  • STDEV関数(標準偏差)の2乗 = VAR関数(分散)
  • 迷ったらVAR関数を選んでおけば安全

次のステップ:関連する統計関数

VAR関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。

タイトルとURLをコピーしました