スプレッドシートのVAR.P関数の使い方|母分散を求める方法

スポンサーリンク

「全社員の売上データのばらつきを数字で出したいけど、VAR関数とVAR.P関数、どっちを使えばいいんだろう?」。こんな疑問を感じたことはありませんか?

データが全員分そろっているなら、VAR関数ではなくVAR.P関数を使うのが正解です。計算方法が違うので、使い分けを間違えると結果がずれてしまいます。

この記事ではVAR.P関数の基本から実務活用まで解説します。VAR関数との違いも比較表で整理しました。

VAR.P関数とは?母集団の分散を求める関数

VAR.P関数(読み方: バー・ピー関数)は、データの母分散を返す関数です。「VAR」は「Variance(分散)」、「P」は「Population(母集団)」の略です。

母分散とは、データ全体のばらつきを数値化した指標です。値が大きいほどデータのばらつきが大きくなります。値が0なら、すべてのデータが同じ値ということです。

たとえば、クラス30人全員のテスト結果があるとします。全員分のデータがそろっているので「母集団」です。この場合はVAR.P関数でばらつきを測ります。

VAR.P関数にできることをまとめると、次のとおりです。

  • データ全体のばらつき(母分散)を数値で求める
  • 複数のグループのばらつきを比較する
  • 品質管理やテスト結果の分析に活用する
  • AVERAGE関数と組み合わせてデータの散らばり具合を定量化する

NOTE

VAR.P関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。旧名称のVARP関数とも同じ計算結果になります。

VAR.P関数の書き方(構文と引数)

基本構文

=VAR.P(値1, [値2], ...)

カッコの中に、分散を求めたいデータやセル範囲を指定します。

引数の説明

引数必須/任意説明
値1必須分散を求めたい最初の値またはセル範囲
値2, …任意追加の値またはセル範囲。最大255個まで指定可能

引数にはセル参照、セル範囲、数値を直接指定できます。

TIP

セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。

「母集団」の分散とは?

VAR.P関数が返すのは母集団の分散です。ちょっとむずかしく聞こえますが、考え方はシンプルです。

  • 母集団: データが全部そろっている場合(例: クラス30人全員のテスト結果)
  • 標本: データの一部だけを取り出した場合(例: 社員1,000人のうち100人を抜き出して調査)

手元のデータが「全員分」「全期間分」なら、VAR.P関数を使います。計算では偏差平方和を「n(データ個数)」で割ります。

データが全体の一部なら、VAR関数を使います。この違いについては後半の「使い分け」セクションで詳しく説明します。

VAR.P関数の基本的な使い方

以下の売上データでVAR.P関数を使ってみましょう。

B2からB11に営業部10人全員の月間売上データ(万円)が入っているとします。

 A列(担当者)B列(売上)
2行目田中120
3行目鈴木85
4行目佐藤200
5行目山田150
6行目高橋95
7行目伊藤180
8行目渡辺110
9行目中村130
10行目小林160
11行目加藤140

母分散を求める

=VAR.P(B2:B11)

結果は約 1,265.63 です。10人全員のデータなので「母集団」として計算されます。各担当者の売上が平均値(137万円)からどれくらい離れているかを表しています。

NOTE

同じデータにVAR関数を使うと約1,406.25になります。VAR.P関数のほうがやや小さい値になるのは、計算方法の違い(nで割るかn-1で割るか)によるものです。

分散の値をどう読むか

分散の値だけでは「大きい」「小さい」の判断がしにくいですよね。比較対象があると意味が出てきます。

たとえば、2つの部署の売上データを比べてみましょう。

部署平均売上母分散(VAR.P)
営業1課137万円1,265.63
営業2課137万円121.00

平均売上は同じでも、営業1課の分散は営業2課の約10倍です。営業1課のほうが売上のばらつきが大きいことがわかります。

TIP

分散の単位は「元データの2乗」になります。売上(万円)の分散は「万円の2乗」です。直感的にわかりにくいと感じたら、STDEV.P関数で母標準偏差に変換しましょう。標準偏差は元データと同じ単位(万円)です。

VAR.P関数の実践的な使い方・応用例

データのばらつきを比較する

分散は「ばらつきの大きさ」を表す数値なので、複数のデータ群を比較するのに使えます。

たとえば、3つの店舗の日次売上の安定度を比較してみましょう。全営業日のデータがそろっているので、母分散を使います。

=VAR.P(B2:B31)
=VAR.P(C2:C31)
=VAR.P(D2:D31)

分散が小さい店舗ほど安定しています。ただし、平均値が異なる店舗を比較する場合は注意が必要です。

平均値が違うと分散の大小だけでは公平に比較できません。その場合は変動係数(CV)を使います。

=STDEV.P(B2:B31)/AVERAGE(B2:B31)

変動係数は「平均値に対するばらつきの割合」です。単位やスケールが違うデータ同士の比較にも使えます。

品質管理で使う(管理範囲の算出)

全製品の検査データがそろっている場合、母分散から管理範囲を算出できます。B2:B101に全製品の検査データが入っているとします。

=AVERAGE(B2:B101) - 2*SQRT(VAR.P(B2:B101))
=AVERAGE(B2:B101) + 2*SQRT(VAR.P(B2:B101))

SQRT関数で分散を標準偏差に変換してから計算しています。「平均+-2sigma」の範囲にデータの約95%が収まります。

TIP

標準偏差を直接求めるなら、=SQRT(VAR.P(B2:B101)) の代わりに STDEV.P関数 を使うほうが簡単です。品質管理では母集団として扱うので、STDEV関数ではなくSTDEV.P関数を選んでください。

偏差平方和を求める

分散に「データ個数」を掛けると、偏差平方和が求まります。偏差平方和は回帰分析や分散分析の基礎になる値です。

=VAR.P(B2:B11) * COUNT(B2:B11)

COUNT関数でデータ個数を数え、そのまま掛けています。VAR関数(標本分散)の場合は「n-1」を掛けますが、VAR.P関数は「n」で割っているので「n」を掛ければ元に戻ります。

よくあるエラーと対処法

#DIV/0!エラー

VAR.P関数で最もよく見るエラーです。以下の原因が考えられます。

原因対策
範囲内に数値データがない文字列ばかりの範囲を指定していないか確認する
数値データが0個1個以上の数値データを指定する

NOTE

VAR関数は最低2個の数値が必要ですが、VAR.P関数は1個でも計算できます(結果は0になります)。0個の場合にのみ#DIV/0!エラーが発生します。

#VALUE!エラー

引数に文字列を直接入力すると発生します。

=VAR.P("100", "200")   → #VALUE!エラー
=VAR.P(100, 200)        → 正常に計算される

セル範囲内に文字列がある場合は自動で無視されます。文字列を直接引数として渡した場合にのみ発生するエラーです。

結果が0になるケース

すべてのデータが同じ値の場合、分散は0になります。これはエラーではなく「ばらつきがまったくない」という正しい結果です。

TIP

期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。VAR.P関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。COUNT関数で数値の個数を確認するのがおすすめです。

VAR関数・STDEV.P関数との違い・使い分け

VAR.P関数とVAR関数の比較表

VAR.P関数とVAR関数は、どちらも分散を求める関数ですが、計算方法が異なります。

項目VAR.PVAR
正式名称母集団の分散標本分散
計算で割る数nn – 1
使う場面データが全部そろっているときデータが全体の一部のとき
結果やや小さくなるやや大きくなる
最低データ数1個2個
旧名称VARPVAR.S

同じデータでもVAR関数のほうが値がやや大きくなります。VAR関数はn-1で割ることで「全体のばらつきをより正確に推定する」補正をかけているためです。

どちらを使えばいいか迷ったら

以下の基準で判断してください。

  • VAR.P関数を使う場面: クラス全員のテスト結果、全社員の売上データ、全店舗の月間売上、全製品の検査データ
  • VAR関数を使う場面: アンケート結果(回答者は全体の一部)、サンプル検査、一部の顧客データの分析

迷ったらVAR関数を選んでおけば安全です。n-1で割るほうが推定値として保守的になるため、判断を誤るリスクが低くなります。

NOTE

データ件数が30を超えると、VAR関数とVAR.P関数の差はほとんどなくなります。どちらを使っても実務上の問題はありません。

STDEV.P関数との関係

STDEV.P関数母標準偏差を返す関数です。母分散と母標準偏差の関係は以下のとおりです。

  • 母分散 = 母標準偏差の2乗
  • 母標準偏差 = 母分散の平方根

つまり =VAR.P(B2:B11)=STDEV.P(B2:B11)^2 は同じ結果になります。

関数返す値単位
VAR.P母分散元データの2乗
STDEV.P母標準偏差元データと同じ

分散は「2乗単位」なので直感的に解釈しにくいです。たとえば売上データ(万円)の分散は「万円の2乗」です。一方、標準偏差は「万円」で表せます。

実務ではSTDEV.P関数(母標準偏差)のほうが使われる場面が多いです。ただし、分散は統計計算の中間値として重要です。分散分析やポートフォリオのリスク計算など、分散が直接必要になる場面もあります。

関連関数の一覧

関数説明計算方法
VAR.P母集団の分散nで割る
VARPVAR.Pの旧名称nで割る
VAR標本分散n-1で割る
VAR.SVARと同じ(新名称)n-1で割る
STDEV.P母集団の標準偏差nで割る
STDEV標本標準偏差n-1で割る

まとめ

VAR.P関数は、データの母集団の分散を返す関数です。

この記事のポイント

  • 構文は =VAR.P(値1, [値2], ...) で、セル範囲を指定するだけ
  • 母分散はデータ全体のばらつきを数値化した指標
  • データが「全部そろっている」→ VAR.P関数、「全体の一部」→ VAR関数
  • 分散の単位は「元データの2乗」。直感的に読みたいなら母標準偏差(STDEV.P関数)を使う
  • STDEV.P関数(母標準偏差)の2乗 = VAR.P関数(母分散)

次のステップ:関連する統計関数

VAR.P関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。

タイトルとURLをコピーしました