「VAR.S関数ってVAR関数と何が違うの?」。スプレッドシートで分散を調べていると、似た名前の関数がいくつも出てきて混乱しますよね。
結論からいうと、VAR.S関数とVAR関数は同じ計算をする関数です。ただし名前が違う理由があり、使い分けのルールも知っておくと迷わなくなります。
この記事ではVAR.S関数の基本から実務での活用例まで解説します。VAR関数やVAR.P関数との違いもあわせて整理しました。
スプレッドシートのVAR.S関数とは?標本分散を求める関数
VAR.S関数(読み方: バー・エス関数)は、データの標本分散を返す関数です。「VAR」は「Variance(分散)」、「S」は「Sample(標本)」の略です。
標本分散とは、一部のデータから全体のばらつきを推定するための指標です。値が大きいほどデータのばらつきが大きくなります。
たとえば、社員1,000人のうち100人を抽出してアンケートを取ったとします。この100人分のデータは「標本(サンプル)」です。標本から全体のばらつきを推定するときにVAR.S関数を使います。
VAR.S関数にできることをまとめると、次のとおりです。
- データのばらつき(標本分散)を数値で求める
- 複数のデータ群のばらつきを比較する
- 品質管理やテスト結果の分析に活用する
- AVERAGE関数と組み合わせてデータの散らばり具合を定量化する
NOTE
VAR.S関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。VAR関数とまったく同じ計算結果になります。
VAR.S関数の書き方(構文と引数)
基本構文
=VAR.S(値1, [値2], ...)
カッコの中に、分散を求めたいデータやセル範囲を指定します。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 値1 | 必須 | 分散を求めたい最初の値またはセル範囲 |
| 値2, … | 任意 | 追加の値またはセル範囲。最大255個まで指定可能 |
引数にはセル参照、セル範囲、数値を直接指定できます。
TIP
セル範囲内の文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になりますよ。
「標本」分散とは?
VAR.S関数が返すのは標本分散です。ちょっとむずかしく聞こえますが、考え方はシンプルです。
- 標本: データの一部だけを取り出した場合(例: 全社員のうち100人を抜き出して調査)
- 母集団: データが全部そろっている場合(例: クラス30人全員のテスト結果)
手元のデータが「全体の一部」なら、VAR.S関数を使います。計算では「n-1」で割ることで、全体のばらつきをより正確に推定します。
データが全員分そろっているなら、VAR.P関数を使います。この違いについては後半の「使い分け」セクションで詳しく説明しますね。
VAR.S関数の基本的な使い方
以下の売上データでVAR.S関数を使ってみましょう。
B2からB8に7人分の月間売上データ(万円)が入っているとします。
| A列(担当者) | B列(売上) | |
|---|---|---|
| 2行目 | 田中 | 150 |
| 3行目 | 鈴木 | 80 |
| 4行目 | 佐藤 | 200 |
| 5行目 | 山田 | 120 |
| 6行目 | 高橋 | 90 |
| 7行目 | 伊藤 | 170 |
| 8行目 | 渡辺 | 130 |
分散を求める
=VAR.S(B2:B8)
結果は約 1,828.57 です。各担当者の売上が平均値(約134.3万円)からどれくらい離れているかを表しています。
検算してみましょう。平均値は(150+80+200+120+90+170+130)/7 = 940/7 = 約134.3です。各値と平均の差を2乗して合計し、(n-1)=6で割った値が標本分散になります。
分散の値をどう読むか
分散の値だけでは「大きい」「小さい」の判断がしにくいですよね。比較対象があると意味が出てきます。
たとえば、2つのチームの売上データを比べてみましょう。
| チーム | 平均売上 | 分散 |
|---|---|---|
| Aチーム | 134万円 | 1,829 |
| Bチーム | 134万円 | 225 |
平均売上は同じでも、Aチームの分散はBチームの約8倍です。Aチームのほうが売上のばらつきが大きいことがわかります。
TIP
分散の単位は「元データの2乗」です。売上(万円)の分散は「万円の2乗」になるため直感的に読みにくいです。ばらつきを元データと同じ単位で見たいときは、STDEV.S関数で標準偏差に変換しましょう。
VAR.S関数の実践的な使い方・応用例
データのばらつきを比較する
分散は「ばらつきの大きさ」を表す数値なので、複数のデータ群を比較するのに使えます。
たとえば、3チームの売上の安定度を比較してみましょう。
=VAR.S(B2:B8)
=VAR.S(C2:C8)
=VAR.S(D2:D8)
分散が小さいチームほど安定しています。ただし、平均値が異なるチームを比較する場合は注意が必要です。
平均値が違うと分散の大小だけでは公平に比較できません。その場合は変動係数(CV)(データのばらつきを相対的に比較する指標)を使います。
=STDEV.S(B2:B8)/AVERAGE(B2:B8)
変動係数は「平均値に対するばらつきの割合」です。単位やスケールが違うデータ同士の比較にも使えますよ。
分散を使って外れ値を検出する
平均から大きく離れたデータ(外れ値)を検出するのにも分散は役立ちます。
「平均 +/- 標準偏差の2倍」の範囲から外れるデータを検出する数式です。
=IF(ABS(B2-AVERAGE($B$2:$B$8))>2*SQRT(VAR.S($B$2:$B$8)), "外れ値", "")
この数式をB2と同じ行のC列に入れて下方向にコピーすれば、外れ値に「外れ値」と表示されます。
TIP
外れ値の検出には分散そのものよりも、標準偏差(分散の平方根)を使うのが一般的です。
=SQRT(VAR.S(B2:B8))と=STDEV.S(B2:B8)は同じ結果になりますよ。
偏差平方和を求める
分散に「データ個数 – 1」を掛けると、偏差平方和(各データと平均の差を2乗して合計した値)が求まります。偏差平方和は回帰分析や分散分析の基礎になる値です。
=VAR.S(B2:B8) * (COUNT(B2:B8) - 1)
COUNT関数でデータ個数を数え、そこから1を引いた値を掛けています。
よくあるエラーと対処法
#DIV/0!エラー
VAR.S関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| 数値データが1個しかない | 2個以上の数値データを指定する |
| 範囲内に数値が含まれていない | 文字列ばかりの範囲を指定していないか確認する |
標本分散を計算するには最低2個の数値が必要です。1個しかないと「ばらつき」を求められないためエラーになります。
#VALUE!エラー
引数に文字列を直接入力すると発生します。
=VAR.S("100", "200") → #VALUE!エラー
=VAR.S(100, 200) → 正常に計算される
セル範囲内に文字列がある場合は自動で無視されるので安心してください。文字列を直接引数として渡した場合にのみ発生するエラーです。
#NAME?エラー
関数名のスペルミスで発生します。「VAR.S」のピリオドを忘れて「VARS」と入力すると、このエラーが出ます。
=VARS(B2:B8) → #NAME?エラー
=VAR.S(B2:B8) → 正常に計算される
ピリオドの位置に注意してくださいね。
結果が0になるケース
すべてのデータが同じ値の場合、分散は0になります。これはエラーではなく「ばらつきがまったくない」という正しい結果です。
TIP
期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。VAR.S関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。COUNT関数で数値の個数を確認するのがおすすめですよ。
VAR関数・VAR.P関数との違い・使い分け
VAR.S関数とVAR関数の違い
結論からいうと、VAR.S関数とVAR関数はまったく同じ関数です。
| 項目 | VAR.S | VAR |
|---|---|---|
| 計算結果 | 標本分散 | 標本分散 |
| 割る数 | n – 1 | n – 1 |
| 結果の違い | なし(完全に同じ) | なし(完全に同じ) |
ではなぜ2つの名前があるのでしょうか。もともとスプレッドシートには「VAR」と「VARP」がありました。しかし「標本」と「母集団」の区別がわかりにくいという声がありました。そこで「VAR.S」(Sample)と「VAR.P」(Population)という対称的な名前が追加されたのです。
つまりVAR.Sは「VARの新しい名前」です。どちらを使っても結果は変わりません。
どちらを使えばいいか
新規で数式を書くならVAR.S関数がおすすめです。理由は以下のとおりです。
- VAR.P関数と名前の対称性があり、使い分けがわかりやすい
- 「S = Sample(標本)」という意味が名前に含まれている
- 既存のVAR関数は今後も使えるので、書き換える必要はない
すでにVAR関数を使っている数式をわざわざ修正する必要はありませんよ。
VAR.S関数とVAR.P関数の違い
VAR.S関数とVAR.P関数は、計算方法が異なります。
| 項目 | VAR.S | VAR.P |
|---|---|---|
| 正式名称 | 標本分散 | 母集団の分散 |
| 割る数 | n – 1 | n |
| 使う場面 | データが全体の一部のとき | データが全部そろっているとき |
| 結果 | やや大きくなる | やや小さくなる |
同じデータでもVAR.S関数のほうが値がやや大きくなります。これは一部のデータから全体を推定するための補正です。
どちらを使うか迷ったら
以下の基準で判断してみてください。
- VAR.S関数を使う場面: アンケート結果(回答者は全体の一部)、サンプル検査、一部の顧客データの分析
- VAR.P関数を使う場面: クラス全員のテスト結果、全社員の評価データ、全店舗の月間売上
迷ったらVAR.S関数を選んでおけば安全です。n-1で割るほうが推定値として保守的になるため、判断を誤るリスクが低くなりますよ。
NOTE
データ件数が30を超えると、VAR.S関数とVAR.P関数の差はほとんどなくなります。どちらを使っても実務上の問題はありません。
STDEV.S関数との関係
STDEV.S関数は標本標準偏差を返す関数です。分散と標準偏差の関係は以下のとおりです。
- 分散 = 標準偏差の2乗
- 標準偏差 = 分散の平方根(ルート)
つまり =VAR.S(B2:B8) と =STDEV.S(B2:B8)^2 は同じ結果になります。
| 関数 | 返す値 | 単位 |
|---|---|---|
| VAR / VAR.S | 分散(標本分散) | 元データの2乗 |
| STDEV / STDEV.S | 標準偏差(標本標準偏差) | 元データと同じ |
標準偏差は元データと同じ単位なので直感的に理解しやすいです。実務ではSTDEV.S関数(標準偏差)を使うのが一般的です。ただし、分散分析やポートフォリオのリスク計算など、分散が直接必要になる場面もありますよ。
関連関数の一覧
| 関数 | 説明 | 計算方法 |
|---|---|---|
| VAR | 標本分散 | n-1で割る |
| VAR.S | VARと同じ(新名称) | n-1で割る |
| VAR.P | 母集団の分散 | nで割る |
| VARP | VAR.Pの旧名称 | nで割る |
| STDEV | 標本標準偏差 | n-1で割る |
| STDEV.S | STDEVと同じ(新名称) | n-1で割る |
まとめ
VAR.S関数は、データの標本分散を返す関数です。VAR関数とまったく同じ計算をします。
この記事のポイント
- 構文は
=VAR.S(値1, [値2], ...)で、セル範囲を指定するだけ - VAR.S関数とVAR関数は同じ関数。「S = Sample(標本)」の意味
- 新規で書くならVAR.S関数がおすすめ(VAR.Pとの対称性がわかりやすい)
- データが「全体の一部」→ VAR.S関数、「全部そろっている」→ VAR.P関数
- 迷ったらVAR.S関数を選んでおけば安全
関連する統計関数
VAR.S関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。
