「この売上データ、気温と関係あるのかな?」「広告費を増やしたら売上って上がってるの?」
こんなふうに、2つのデータの関連性を数字で確かめたいときってありますよね。なんとなく「関係ありそう」と感じていても、感覚だけで判断するのは少し不安です。
そんなときに使えるのがExcelの CORREL関数 です。2つのデータ範囲を指定するだけで、-1〜1の相関係数を自動計算してくれます。この記事では、基本的な使い方から相関係数の読み取り方、散布図との組み合わせ、実務活用例まで一通り紹介していきますね。
ExcelのCORREL関数とは?
CORREL関数は、2つのデータセットの相関係数(ピアソン相関係数)を返す統計関数です。
- 読み方: コリレーション(Correlation = 相関の意味)
- 戻り値: -1〜1 の数値
- 対応バージョン: Excel 2007 以降 / Microsoft 365 / Google スプレッドシート
相関係数とは、2つのデータがどれだけ連動しているかを表す指標です。たとえば「気温が上がるとアイスの売上も上がる」なら正の相関、「気温が上がると鍋の売上が下がる」なら負の相関になります。
TIP
相関係数は「2つのデータが一緒に動くかどうか」を見る指標です。1に近いほど同じ方向に動き、-1に近いほど逆方向に動きます。0に近いと関連性がほとんどないことを意味します。
CORREL関数の書き方(構文と引数)
基本構文
=CORREL(配列1, 配列2)
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 配列1 | 必須 | 比較したいデータ範囲の1つ目(例: 気温データ) |
| 配列2 | 必須 | 比較したいデータ範囲の2つ目(例: 売上データ) |
引数はたった2つだけなのでシンプルですよね。注意点として、配列1と配列2のデータ数は同じにしてください。データ数が異なると #N/A エラーになります。
基本的な使い方
実際にCORREL関数を使ってみましょう。
たとえば、あるお店で12か月分の「平均気温」と「アイスクリームの売上」を記録したとします。
| A列(月) | B列(平均気温) | C列(売上) | |
|---|---|---|---|
| 2行目 | 1月 | 5 | 120 |
| 3行目 | 2月 | 6 | 135 |
| 4行目 | 3月 | 10 | 180 |
| 5行目 | 4月 | 15 | 250 |
| 6行目 | 5月 | 20 | 320 |
| 7行目 | 6月 | 25 | 410 |
| 8行目 | 7月 | 30 | 520 |
| 9行目 | 8月 | 32 | 550 |
| 10行目 | 9月 | 27 | 430 |
| 11行目 | 10月 | 18 | 280 |
| 12行目 | 11月 | 12 | 190 |
| 13行目 | 12月 | 7 | 140 |
この2つのデータの相関係数を求める数式はこちらです。
=CORREL(B2:B13, C2:C13)
結果は 約0.99 になります。1にとても近い値なので、気温と売上には強い正の相関があることがわかりますね。
相関係数の読み取り方(強弱の目安表)
CORREL関数の結果が出ても「0.65って強いの?弱いの?」と迷うことがありますよね。以下の目安表を参考にしてください。
| 相関係数の範囲 | 強さの目安 | 解釈 |
|---|---|---|
| 0.7 〜 1.0 | 強い正の相関 | 一方が増えると、もう一方もかなり増える |
| 0.4 〜 0.7 | やや正の相関 | 一方が増えると、もう一方も増える傾向 |
| 0.2 〜 0.4 | 弱い正の相関 | わずかに同じ方向に動く傾向 |
| -0.2 〜 0.2 | ほぼ無相関 | 2つのデータに関連性はほぼない |
| -0.4 〜 -0.2 | 弱い負の相関 | わずかに逆方向に動く傾向 |
| -0.7 〜 -0.4 | やや負の相関 | 一方が増えると、もう一方は減る傾向 |
| -1.0 〜 -0.7 | 強い負の相関 | 一方が増えると、もう一方はかなり減る |
ビジネスの現場では 0.4以上(または-0.4以下) であれば「関連がありそうだ」と判断するケースが多いですよ。
WARNING
相関関係は因果関係ではありません。 相関係数が高いからといって、「Aが原因でBが起きている」とは限りません。たとえば「アイスの売上」と「水難事故の件数」は強い相関を示しますが、アイスが水難事故を引き起こしているわけではなく、「気温」という第三の要因が両方に影響しています。データ分析の際は、この点を常に意識してくださいね。
実務で使える活用例
活用例1: 広告費と売上の関係を分析する
マーケティング部門では「広告費を増やしたら売上は増えるのか?」という問いがよく出てきます。
月別の広告費(D列)と売上(E列)があるとして、次の数式で相関を確認できます。
=CORREL(D2:D13, E2:E13)
結果が0.7以上なら、広告投資に効果がある可能性が高いと判断できます。逆に0.2程度なら、広告費以外の要因が売上を左右していることがわかりますね。
活用例2: 複数の要因を比較して最も影響が大きいものを特定する
売上に影響しそうな要因が複数ある場合、それぞれの相関係数を並べて比較すると優先順位が見えてきます。
=CORREL(気温, 売上) → 0.92
=CORREL(広告費, 売上) → 0.65
=CORREL(競合価格, 売上) → -0.31
この結果なら「気温の影響が最も大きく、広告費もそこそこ影響あり、競合価格は弱い逆相関」と読み取れます。施策の優先順位づけに使えますよ。
活用例3: 在庫管理と需要予測のヒントにする
過去データで「曜日ごとの来客数」と「特定商品の販売数」の相関を調べておくと、仕入れ量の判断材料になります。相関が強いとわかれば、来客数の予測から販売数を見積もることができますよね。
散布図と組み合わせて視覚化する
CORREL関数で数値を出したら、散布図と組み合わせるとさらにわかりやすくなります。数値だけでは伝わりにくい相関の傾向も、グラフにすれば一目瞭然です。
散布図の作り方
- 2つのデータ列(例: B2:C13)を選択する
- 「挿入」タブ → 「グラフ」 → 「散布図」を選択する
- 点の並びが右肩上がりなら正の相関、右肩下がりなら負の相関
近似曲線を追加する
散布図上でデータ点を右クリック → 「近似曲線の追加」を選ぶと、データの傾向を直線で表示できます。「R-2乗値を表示する」にチェックを入れると、相関の強さを視覚的にも確認できますよ。
TIP
R-2乗値(R²)は相関係数を2乗した値です。CORREL関数の結果が0.9なら R²=0.81 となり、「一方のデータで他方の81%を説明できる」と解釈できます。
よくあるエラーと対処法
| エラー | 原因 | 対処法 |
|---|---|---|
#N/A | 配列1と配列2のデータ数が異なる | セル範囲の行数を揃える |
#DIV/0! | データが1つしかない、またはすべて同じ値 | データ数を2つ以上にする。値にばらつきがあるか確認する |
#VALUE! | 範囲内に文字列が含まれている | 数値以外のセルを除外するか、数値に変換する |
なお、CORREL関数は数値以外のセル(空白や文字列)を自動的に無視します。ただし、一方のセルが数値で他方が空白というペアがあると、そのペアごと計算から除外される点に注意してください。
PEARSON関数との違い
ExcelにはCORRELとよく似た PEARSON関数 があります。
=PEARSON(B2:B13, C2:C13)
実は、CORREL関数とPEARSON関数はまったく同じ計算結果を返します。どちらもピアソンの積率相関係数を計算する関数で、内部の計算式も同じです。
| 項目 | CORREL | PEARSON |
|---|---|---|
| 戻り値 | ピアソン相関係数 | ピアソン相関係数 |
| 計算結果 | 同じ | 同じ |
| 対応バージョン | Excel 2007〜 | Excel 2007〜 |
| 名前の由来 | Correlation(相関) | Karl Pearson(統計学者) |
どちらを使っても結果は同じなので、チームで統一しておけばOKです。一般的にはCORREL関数のほうが使われる頻度が高いですよ。
関連する統計関数との使い分け
CORREL関数の周辺には、データ分析で一緒に使うことの多い統計関数があります。
| 関数 | 用途 | CORREL関数との関係 |
|---|---|---|
| AVERAGE | 平均値を求める | 相関分析の前に各データの平均を確認する |
| MEDIAN | 中央値を求める | 外れ値がある場合の代表値として使う |
| STDEV.P / STDEV.S | 標準偏差を求める | データのばらつき具合を確認する |
| LARGE / SMALL | N番目に大きい/小さい値 | 外れ値の特定に使う |
| RANK | 順位をつける | 相関分析後のランキング作成に使う |
| COVARIANCE.P | 共分散を求める | 相関係数の計算に使われる中間値 |
TIP
CORREL関数の計算式は「共分散 ÷(配列1の標準偏差 × 配列2の標準偏差)」です。COVARIANCE.P関数とSTDEV.P関数を使って手動計算することもできますが、CORREL関数を使えば一発で求められます。
まとめ
| 項目 | 内容 |
|---|---|
| 関数名 | CORREL(コリレーション) |
| 構文 | =CORREL(配列1, 配列2) |
| 戻り値 | -1〜1 の相関係数 |
| 正の相関 | 1に近い → 一緒に増減する |
| 負の相関 | -1に近い → 逆方向に動く |
| 無相関 | 0に近い → 関連性なし |
| PEARSON関数 | 同じ結果を返す |
| 注意点 | 相関関係 ≠ 因果関係 |
CORREL関数は引数が2つだけのシンプルな関数ですが、ビジネスデータの分析で非常に強力なツールです。まずは身近なデータ(売上と天気、広告費と問い合わせ数など)で試してみてください。散布図と組み合わせると、上司への報告資料もグッと説得力が増しますよ。
