「売上と広告費って連動してるのかな?」「気温が上がると来客数は増えるの?」――Excelでこんなふうに気になったこと、ありませんか?
2つのデータの関係性を数値で確かめたいのに、やり方がわからないと、なんとなくの”勘”で判断するしかなくて不安ですよね。
そんなときに役立つのが COVAR関数 です。この記事では、COVAR関数の使い方を基本から実務での活用例まで、やさしく解説していきます。
ExcelのCOVAR関数とは?
COVAR関数は、2つのデータセットの 共分散(きょうぶんさん) を求める関数です。読み方は「コバリアンス」です。
共分散とは、2つのデータが「一緒に動く傾向があるかどうか」を数値にしたものです。
- 正の値 → 一方が増えると、もう一方も増える傾向(例: 広告費と売上)
- 負の値 → 一方が増えると、もう一方は減る傾向(例: 気温とホットドリンク売上)
- 0に近い → 2つのデータに目立った関係がない
つまり、COVAR関数を使えば「この2つのデータは連動しているのか?」をひと目で判断できるわけですね。
COVAR関数は互換性関数
COVAR関数はExcel 2003以前から使える古い関数です。Excel 2010以降では後継関数が用意されています。具体的には COVARIANCE.P関数 と COVARIANCE.S関数 の2つです。
現在も互換性のために使えますが、新しくシートを作るなら後継関数を使うのがおすすめです。既存のブックでCOVAR関数が入っている場合は、そのまま使い続けても問題ありませんよ。
COVAR関数の書き方(構文と引数)
基本構文
=COVAR(配列1, 配列2)
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 配列1 | 必須 | 数値データが入っているセル範囲(1つ目のデータ) |
| 配列2 | 必須 | 数値データが入っているセル範囲(2つ目のデータ) |
引数はどちらも必須です。2つの範囲に含まれるデータの個数は同じにしてください。個数が違うと#N/Aエラーになります。
空白セルや文字列が含まれている場合は、そのセルは自動的に無視されます。
COVAR関数の基本的な使い方
実際にサンプルデータで使ってみましょう。
サンプルデータ
たとえば、ある店舗の月別データとして以下の表があるとします。
| A列(広告費・万円) | B列(売上・万円) | |
|---|---|---|
| 1月 | 10 | 120 |
| 2月 | 15 | 150 |
| 3月 | 8 | 100 |
| 4月 | 20 | 200 |
| 5月 | 12 | 140 |
| 6月 | 18 | 180 |
A2:A7に広告費、B2:B7に売上が入っているとして、数式はこうなります。
=COVAR(A2:A7, B2:B7)
この数式を入力すると、結果は 約143 という正の値が返ります。正の値なので「広告費が増えると売上も増える傾向がある」と読み取れますね。
結果の読み取り方
COVAR関数の結果はデータの単位に依存します。今回は「万円 x 万円」の単位になるため、数値の大小だけで強さを比べるのは少し難しいです。
「正か負か」で方向性を確認するのが基本的な使い方です。関係の強さまで知りたい場合は、後ほど紹介する CORREL関数 を使うと便利ですよ。
COVAR関数の実務での活用例
活用例1: 気温と来客数の関係を調べる
飲食店で「気温が上がると来客数は増えるか?」を確かめたいケースです。
| A列(気温・度) | B列(来客数・人) | |
|---|---|---|
| 月曜 | 15 | 80 |
| 火曜 | 20 | 110 |
| 水曜 | 25 | 130 |
| 木曜 | 18 | 95 |
| 金曜 | 28 | 140 |
| 土曜 | 30 | 160 |
=COVAR(A2:A7, B2:B7)
結果が正の値なら、気温が高いほど来客が増える傾向があるといえます。メニュー構成や仕入れ計画の参考になりますよね。
活用例2: 複数データの関係性を一覧で比較する
「売上と広告費」「売上と気温」「売上と曜日番号」など、複数の組み合わせでCOVAR関数を並べてみましょう。どの要因が売上と最も連動しているかを比較できます。
ただし、単位が異なるデータ同士の共分散は数値の大小を直接比較できません。比較したい場合は CORREL関数 がおすすめです。相関係数に変換すれば、-1から1の範囲で統一的に比較できますよ。
COVARIANCE.P・COVARIANCE.S関数との違い
COVAR関数には2つの後継関数があります。違いを表で整理しておきましょう。
| 関数名 | 計算方法 | 用途 | 備考 |
|---|---|---|---|
| COVAR | n で割る(母集団) | 互換性関数 | COVARIANCE.Pと同じ結果 |
| COVARIANCE.P | n で割る(母集団) | データ全体の共分散 | Excel 2010以降 |
| COVARIANCE.S | n-1 で割る(標本) | 一部データから推定 | Excel 2010以降 |
どれを使えばいいの?
使い分けのポイントはシンプルです。
- データが全体(母集団)のとき → COVARIANCE.P関数(またはCOVAR関数)
- データが一部(標本)のとき → COVARIANCE.S関数
たとえば、社員全員のデータならCOVARIANCE.P、アンケートで一部の社員だけ回答したデータならCOVARIANCE.Sを使います。
COVAR関数とCOVARIANCE.P関数は結果が完全に同じです。新しいシートではCOVARIANCE.Pを使っておけば間違いありませんよ。
CORREL関数との使い分け
共分散と似た指標に 相関係数 があります。相関係数を求めるのが CORREL関数 です。
| 比較項目 | COVAR関数(共分散) | CORREL関数(相関係数) |
|---|---|---|
| 値の範囲 | 制限なし(単位に依存) | -1 から +1 |
| 方向性の判断 | できる(正/負) | できる(正/負) |
| 強さの判断 | 単位が違うと比較しにくい | 異なるデータ間でも比較しやすい |
| 主な用途 | データの方向性をざっくり確認 | 関係の強さを数値で評価 |
「方向だけ知りたい」ならCOVAR関数で十分です。「どれくらい強く関係しているか」まで知りたいなら、CORREL関数が適しています。
実務では、まずCOVAR関数で方向性を確認し、気になるペアをCORREL関数で深掘りする、という流れがスムーズですよ。
COVAR関数でよくあるエラーと対処法
#N/Aエラー
配列1と配列2のデータ個数が一致していないときに発生します。範囲の行数・列数が同じか確認してみてください。
#DIV/0!エラー
データが1個以下しかない場合に発生します。共分散の計算には最低2つのデータペアが必要です。
結果が0になる
片方のデータがすべて同じ値の場合、共分散は0になります。たとえば広告費が毎月同じなら、変動がないので関係性を測れません。データに変動があるか確認してみてくださいね。
文字列や空白が含まれている場合
文字列や空白セルは計算から自動的に除外されます。意図しないセルが含まれていないか、範囲の指定を見直してみてください。
まとめ
ExcelのCOVAR関数は、2つのデータの共分散を求めて「連動しているかどうか」を判断できる関数です。
ポイントをおさらいしておきましょう。
- COVAR関数は共分散(2つのデータの連動性)を返す
- 正の値なら同じ方向、負の値なら逆方向に動く傾向がある
- COVAR関数は互換性関数。新規作成時は COVARIANCE.P関数 を使うのがおすすめ
- 標本データの場合は COVARIANCE.S関数 を選ぶ
- 関係の「強さ」まで知りたいなら CORREL関数 と組み合わせる
データ分析の第一歩として、ぜひ使ってみてくださいね。
