ExcelのCOVAR関数の使い方|共分散で2つのデータの関係を分析

スポンサーリンク

「売上と広告費って連動してるのかな?」「気温が上がると来客数は増えるの?」――Excelでこんなふうに気になったこと、ありませんか?

2つのデータの関係性を数値で確かめたいのに、やり方がわからないと、なんとなくの”勘”で判断するしかなくて不安ですよね。

そんなときに役立つのが COVAR関数 です。この記事では、COVAR関数の使い方を基本から実務での活用例まで、やさしく解説していきます。

ExcelのCOVAR関数とは?

COVAR関数は、2つのデータセットの 共分散(きょうぶんさん) を求める関数です。読み方は「コバリアンス」です。

共分散とは、2つのデータが「一緒に動く傾向があるかどうか」を数値にしたものです。

  • 正の値 → 一方が増えると、もう一方も増える傾向(例: 広告費と売上)
  • 負の値 → 一方が増えると、もう一方は減る傾向(例: 気温とホットドリンク売上)
  • 0に近い → 2つのデータに目立った関係がない

つまり、COVAR関数を使えば「この2つのデータは連動しているのか?」をひと目で判断できるわけですね。

COVAR関数は互換性関数

COVAR関数はExcel 2003以前から使える古い関数です。Excel 2010以降では後継関数が用意されています。具体的には COVARIANCE.P関数COVARIANCE.S関数 の2つです。

現在も互換性のために使えますが、新しくシートを作るなら後継関数を使うのがおすすめです。既存のブックでCOVAR関数が入っている場合は、そのまま使い続けても問題ありませんよ。

COVAR関数の書き方(構文と引数)

基本構文

=COVAR(配列1, 配列2)

引数の説明

引数必須/任意説明
配列1必須数値データが入っているセル範囲(1つ目のデータ)
配列2必須数値データが入っているセル範囲(2つ目のデータ)

引数はどちらも必須です。2つの範囲に含まれるデータの個数は同じにしてください。個数が違うと#N/Aエラーになります。

空白セルや文字列が含まれている場合は、そのセルは自動的に無視されます。

COVAR関数の基本的な使い方

実際にサンプルデータで使ってみましょう。

サンプルデータ

たとえば、ある店舗の月別データとして以下の表があるとします。

 A列(広告費・万円)B列(売上・万円)
1月10120
2月15150
3月8100
4月20200
5月12140
6月18180

A2:A7に広告費、B2:B7に売上が入っているとして、数式はこうなります。

=COVAR(A2:A7, B2:B7)

この数式を入力すると、結果は 約143 という正の値が返ります。正の値なので「広告費が増えると売上も増える傾向がある」と読み取れますね。

結果の読み取り方

COVAR関数の結果はデータの単位に依存します。今回は「万円 x 万円」の単位になるため、数値の大小だけで強さを比べるのは少し難しいです。

「正か負か」で方向性を確認するのが基本的な使い方です。関係の強さまで知りたい場合は、後ほど紹介する CORREL関数 を使うと便利ですよ。

COVAR関数の実務での活用例

活用例1: 気温と来客数の関係を調べる

飲食店で「気温が上がると来客数は増えるか?」を確かめたいケースです。

 A列(気温・度)B列(来客数・人)
月曜1580
火曜20110
水曜25130
木曜1895
金曜28140
土曜30160
=COVAR(A2:A7, B2:B7)

結果が正の値なら、気温が高いほど来客が増える傾向があるといえます。メニュー構成や仕入れ計画の参考になりますよね。

活用例2: 複数データの関係性を一覧で比較する

「売上と広告費」「売上と気温」「売上と曜日番号」など、複数の組み合わせでCOVAR関数を並べてみましょう。どの要因が売上と最も連動しているかを比較できます。

ただし、単位が異なるデータ同士の共分散は数値の大小を直接比較できません。比較したい場合は CORREL関数 がおすすめです。相関係数に変換すれば、-1から1の範囲で統一的に比較できますよ。

COVARIANCE.P・COVARIANCE.S関数との違い

COVAR関数には2つの後継関数があります。違いを表で整理しておきましょう。

関数名計算方法用途備考
COVARn で割る(母集団)互換性関数COVARIANCE.Pと同じ結果
COVARIANCE.Pn で割る(母集団)データ全体の共分散Excel 2010以降
COVARIANCE.Sn-1 で割る(標本)一部データから推定Excel 2010以降

どれを使えばいいの?

使い分けのポイントはシンプルです。

  • データが全体(母集団)のとき → COVARIANCE.P関数(またはCOVAR関数)
  • データが一部(標本)のとき → COVARIANCE.S関数

たとえば、社員全員のデータならCOVARIANCE.P、アンケートで一部の社員だけ回答したデータならCOVARIANCE.Sを使います。

COVAR関数とCOVARIANCE.P関数は結果が完全に同じです。新しいシートではCOVARIANCE.Pを使っておけば間違いありませんよ。

CORREL関数との使い分け

共分散と似た指標に 相関係数 があります。相関係数を求めるのが CORREL関数 です。

比較項目COVAR関数(共分散)CORREL関数(相関係数)
値の範囲制限なし(単位に依存)-1 から +1
方向性の判断できる(正/負)できる(正/負)
強さの判断単位が違うと比較しにくい異なるデータ間でも比較しやすい
主な用途データの方向性をざっくり確認関係の強さを数値で評価

「方向だけ知りたい」ならCOVAR関数で十分です。「どれくらい強く関係しているか」まで知りたいなら、CORREL関数が適しています。

実務では、まずCOVAR関数で方向性を確認し、気になるペアをCORREL関数で深掘りする、という流れがスムーズですよ。

COVAR関数でよくあるエラーと対処法

#N/Aエラー

配列1と配列2のデータ個数が一致していないときに発生します。範囲の行数・列数が同じか確認してみてください。

#DIV/0!エラー

データが1個以下しかない場合に発生します。共分散の計算には最低2つのデータペアが必要です。

結果が0になる

片方のデータがすべて同じ値の場合、共分散は0になります。たとえば広告費が毎月同じなら、変動がないので関係性を測れません。データに変動があるか確認してみてくださいね。

文字列や空白が含まれている場合

文字列や空白セルは計算から自動的に除外されます。意図しないセルが含まれていないか、範囲の指定を見直してみてください。

まとめ

ExcelのCOVAR関数は、2つのデータの共分散を求めて「連動しているかどうか」を判断できる関数です。

ポイントをおさらいしておきましょう。

  • COVAR関数は共分散(2つのデータの連動性)を返す
  • 正の値なら同じ方向、負の値なら逆方向に動く傾向がある
  • COVAR関数は互換性関数。新規作成時は COVARIANCE.P関数 を使うのがおすすめ
  • 標本データの場合は COVARIANCE.S関数 を選ぶ
  • 関係の「強さ」まで知りたいなら CORREL関数 と組み合わせる

データ分析の第一歩として、ぜひ使ってみてくださいね。

タイトルとURLをコピーしました