「アンケート結果のばらつきを数値で出したいけど、分散ってどうやって求めるんだろう?」。こんな疑問を感じたことはありませんか?
平均値だけでは、データが均一なのかバラバラなのかが見えませんよね。サンプルデータのばらつきを正しく測るには、標本分散を求める関数が必要です。
そんなときに使うのがExcelのVAR.S関数です。この記事では基本の書き方から実務での活用例まで解説します。VAR.P関数(母分散)との違いや旧VAR関数との互換性もあわせて整理しました。
ExcelのVAR.S関数とは?標本の分散を求める関数
VAR.S関数(読み方: バー・エス)は、データの標本分散(ふへんぶんさん)を返す関数です。「VAR」は「Variance(分散)」、「S」は「Sample(標本)」の頭文字です。
分散とは、データが平均値からどれくらい離れているかを数値化した指標です。値が大きいほどデータのばらつきが大きくなります。値が0なら、すべてのデータが同じ値ということです。
身近な例で考えてみましょう。社員500人のうち50人を抜き出してアンケートを実施したとします。この50人分の回答データは「全体の一部=標本」です。標本から全体のばらつきを正しく推定するときに使うのがVAR.S関数です。
VAR.S関数にできることをまとめると、次のとおりです。
- 標本データから母集団の分散を推定する
- アンケート結果やサンプル検査など、一部のデータしかない場面で使う
- 複数グループのばらつきを比較する
- AVERAGE関数と組み合わせてデータの散らばり具合を定量化する
NOTE
VAR.S関数はExcel 2010以降で使えます。Microsoft 365、Excel 2013〜2024のすべてのバージョンに対応していますよ。
VAR.S関数の書き方(構文と引数)
基本構文
=VAR.S(数値1, [数値2], ...)
カッコの中に、分散を求めたいデータやセル範囲を指定します。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 数値1 | 必須 | 分散を求めたい最初の値またはセル範囲 |
| 数値2, … | 任意 | 追加の値またはセル範囲。最大253個まで指定可能 |
引数にはセル参照、セル範囲、数値を直接指定できます。
TIP
セル範囲に含まれる文字列・論理値(TRUE/FALSE)・空白セルは自動的に無視されます。数値だけが計算の対象になりますよ。
「標本」の分散とは?N-1で割る理由
VAR.S関数が返すのは標本分散(不偏分散)です。ちょっとむずかしく聞こえますが、考え方はシンプルです。
- 母集団: データが全部そろっている場合(例: クラス30人全員のテスト結果)
- 標本: データの一部だけを取り出した場合(例: 社員500人のうち50人を抜き出して調査)
手元のデータが「全体の一部」なら、VAR.S関数を使います。計算では「n-1」で割ります。
「なぜn-1で割るの?」と思いますよね。理由はシンプルです。一部のデータだけで平均を出すと、本当の平均からズレが生じます。このズレを補正するために「n」ではなく「n-1」で割る仕組みになっています。nで割ると分散がやや小さめに出てしまうので、n-1で割って少し大きめに補正するわけです。
データが全部そろっているなら、VAR.P関数を使います。この違いについては後半の「使い分け」セクションで詳しく説明しますね。
VAR.S関数の基本的な使い方
以下のテストデータでVAR.S関数を使ってみましょう。
社員500人のうち10人を抜き出して、研修テストの点数を記録したとします。B2からB11にテストの点数が入っています。
| A列(社員名) | B列(点数) | |
|---|---|---|
| 2行目 | 田中 | 72 |
| 3行目 | 鈴木 | 85 |
| 4行目 | 佐藤 | 68 |
| 5行目 | 山田 | 91 |
| 6行目 | 伊藤 | 77 |
| 7行目 | 渡辺 | 83 |
| 8行目 | 中村 | 65 |
| 9行目 | 小林 | 88 |
| 10行目 | 加藤 | 79 |
| 11行目 | 吉田 | 92 |
標本分散を求める
=VAR.S(B2:B11)
結果は 89.6 です。10人分の点数が平均値(80点)からどれくらい散らばっているかを表しています。
TIP
分散の値そのものはイメージしにくいと感じるかもしれません。分散の平方根を取ると標準偏差になります。
=SQRT(VAR.S(B2:B11))で約 9.46 と求められ、「平均から約9.5点の散らばり」と直感的に理解できますよ。
VAR.P関数との結果の違い
同じデータでVAR.P関数を使うと 80.6 になります。VAR.S関数のほうが値がやや大きくなります。
| 関数 | 結果 | 割る数 |
|---|---|---|
| VAR.S | 89.6 | n-1(9) |
| VAR.P | 80.6 | n(10) |
10人は全社員の一部なので、この場面ではVAR.S関数が正しい選択です。
VAR.S関数の実践的な使い方・応用例
アンケート結果のばらつきを部署間で比較する
「部署ごとに満足度のばらつきが違うか」を分析したい場面です。
各部署から5人ずつ抽出し、満足度(10点満点)を調査したとします。C2からC6にA部署、D2からD6にB部署のデータが入っています。
=VAR.S(C2:C6)
=VAR.S(D2:D6)
| 部署 | 平均 | 分散(VAR.S) |
|---|---|---|
| A部署 | 7.2 | 2.7 |
| B部署 | 7.0 | 8.5 |
平均はほぼ同じでも、B部署は分散が大きいですね。つまりB部署は満足している人と不満な人の差が大きいことがわかります。平均だけでは見えない問題を発見できますよ。
品質検査のサンプルデータで製品のばらつきを測る
製造ラインから20個を抜き取り検査して、製品の重量のばらつきを調べる場面です。
B2からB21に20個分の重量データが入っているとします。
=VAR.S(B2:B21)
結果が管理基準の分散を超えていれば、製造工程の見直しが必要です。全数検査ではなく抜き取り検査なので、VAR.S関数で母集団の分散を推定します。
TIP
標準偏差で管理したい場合は STDEV.S関数 を使います。分散 = 標準偏差の2乗なので、
=VAR.S(B2:B21)と=STDEV.S(B2:B21)^2は同じ値を返しますよ。
IF関数と組み合わせて分散の大小を自動判定する
分散が基準値を超えたら「要確認」と表示する仕組みを作ってみましょう。
=IF(VAR.S(B2:B21) > 5, "要確認", "正常")
分散が5を超えたら「要確認」、5以下なら「正常」と表示されます。品質管理や検査レポートの自動判定に使えます。
よくあるエラーと対処法
#DIV/0!エラー
VAR.S関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| 数値が1個しかない | n-1=0で割り算できないため。データが2個以上あるか確認する |
| 範囲内に数値が含まれていない | 文字列ばかりの範囲を指定していないか確認する |
| 空のセル範囲を指定している | データが入力されているセル範囲を確認する |
VAR.P関数は数値が1個でも計算できますが(結果は0)、VAR.S関数は2個以上必要です。ここがVAR.P関数との大きな違いです。
#VALUE!エラー
引数に文字列を直接入力すると発生します。
=VAR.S("100", "200") → #VALUE!エラー
=VAR.S(100, 200) → 正常に計算される
セル範囲内に文字列がある場合は自動で無視されます。ただし引数として直接文字列を渡すとエラーになるので注意してください。
結果が想定より大きい・小さい
期待した値にならないときは、以下をチェックしてみてください。
- セル範囲に文字列が混ざっていないか(無視されてデータ件数が減る)
- VAR.P関数と間違えていないか(nで割るかn-1で割るかで結果が変わる)
- COUNT関数で数値の個数を確認する
TIP
文字列や論理値も分散の計算に含めたい場合は、VARA関数を使います。VARA関数はTRUEを1、FALSEを0、文字列を0として計算に含めますよ。
VAR.P関数やSTDEV関数との違い・使い分け
VAR.S関数とVAR.P関数の違い
VAR.S関数とVAR.P関数は、どちらも分散を求める関数ですが、計算方法が異なります。
| 項目 | VAR.S | VAR.P |
|---|---|---|
| 正式名称 | 標本分散(不偏分散) | 母分散 |
| 割る数 | n – 1(不偏推定) | n |
| 使う場面 | データが全体の一部のとき | データが全部そろっているとき |
| 結果 | やや大きくなる | やや小さくなる |
| 数値1個での動作 | #DIV/0!エラー | 0を返す |
どちらを使えばいいか迷ったら
以下の基準で判断してみてください。
- VAR.S関数を使う場面: アンケート結果、サンプル検査、一部の顧客データの分析、抜き取り検査
- VAR.P関数を使う場面: クラス全員のテスト結果、全社員の売上データ、全店舗の月間売上
判断のポイントは「手元のデータが対象の全数かどうか」です。
- 全社員500人のうち50人だけ調査した → VAR.S
- 全店舗10店のデータを10店分持っている → VAR.P
NOTE
データ件数が30を超えると、VAR.S関数とVAR.P関数の差はほとんどなくなります。迷ったらVAR.S関数を選んでおけば安全ですよ。
分散と標準偏差の関係(4関数の使い分け)
分散と標準偏差は密接に関係しています。標準偏差は分散の平方根です。4つの関数を整理すると次のとおりです。
「ばらつきを元の単位で知りたい」ならSTDEV系、「分散そのものが必要」ならVAR系を選びます。たとえば売上データ(万円)なら、標準偏差は「万円」、分散は「万円の2乗」が単位です。実務で直感的にわかりやすいのは標準偏差ですが、統計的な検定では分散を直接使うこともありますよ。
旧VAR関数との互換性
VAR.S関数はExcel 2010で導入された「新しい名前」の関数です。旧VAR関数と計算結果はまったく同じです。
| 項目 | VAR.S | VAR(旧) |
|---|---|---|
| 導入バージョン | Excel 2010 | Excel 2003以前 |
| 計算結果 | 同一 | 同一 |
| 今後のサポート | 推奨 | 互換性のために残存 |
Microsoftは新しい関数名(VAR.S / VAR.P)の使用を推奨しています。新規で数式を作るときはVAR.S関数を使いましょう。
TIP
旧VAR関数で作られたブックをVAR.Sに書き換える必要はありません。結果は変わらないので、そのまま使い続けて大丈夫ですよ。
関連関数の一覧
| 関数 | 説明 | 計算方法 |
|---|---|---|
| VAR.S | 標本分散(数値のみ) | n-1で割る |
| VAR.P | 母分散(数値のみ) | nで割る |
| VAR | VAR.Sの旧名称 | n-1で割る |
| VARP | VAR.Pの旧名称 | nで割る |
| VARA | 標本分散(文字列・論理値も含む) | n-1で割る |
| STDEV.S | 標本標準偏差 | n-1で割る |
| STDEV.P | 母標準偏差 | nで割る |
| AVERAGE | 平均値を求める | — |
まとめ
ExcelのVAR.S関数は、標本データから分散を返す関数です。
この記事のポイント
- 構文は
=VAR.S(数値1, [数値2], ...)で、セル範囲を指定するだけ - 分散はデータのばらつきを数値化した指標。値が大きいほどばらつきが大きい
- データが「全体の一部」→ VAR.S関数、「全部そろっている」→ VAR.P関数
- n-1で割るのは、標本から母集団を推定するための補正
- 旧VAR関数と計算結果は同じ。新規で作るならVAR.Sを使う
関連記事
VAR.S関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。
