ExcelのCORREL関数の使い方|2つのデータの相関係数を求める方法

スポンサーリンク

「この売上データ、気温と関係あるのかな?」「広告費を増やしたら売上って上がってるの?」

こんなふうに、2つのデータの関連性を数字で確かめたいときってありますよね。なんとなく「関係ありそう」と感じていても、感覚だけで判断するのは少し不安です。

そんなときに使えるのがExcelの CORREL関数 です。2つのデータ範囲を指定するだけで、-1〜1の相関係数を自動計算してくれます。この記事では、基本的な使い方から相関係数の読み取り方、散布図との組み合わせ、実務活用例まで一通り紹介していきますね。

ExcelのCORREL関数とは?

CORREL関数は、2つのデータセットの相関係数(ピアソン相関係数)を返す統計関数です。

  • 読み方: コリレーション(Correlation = 相関の意味)
  • 戻り値: -1〜1 の数値
  • 対応バージョン: Excel 2007 以降 / Microsoft 365 / Google スプレッドシート

相関係数とは、2つのデータがどれだけ連動しているかを表す指標です。たとえば「気温が上がるとアイスの売上も上がる」なら正の相関、「気温が上がると鍋の売上が下がる」なら負の相関になります。

TIP

相関係数は「2つのデータが一緒に動くかどうか」を見る指標です。1に近いほど同じ方向に動き、-1に近いほど逆方向に動きます。0に近いと関連性がほとんどないことを意味します。

CORREL関数の書き方(構文と引数)

基本構文

=CORREL(配列1, 配列2)

引数の説明

引数必須/任意説明
配列1必須比較したいデータ範囲の1つ目(例: 気温データ)
配列2必須比較したいデータ範囲の2つ目(例: 売上データ)

引数はたった2つだけなのでシンプルですよね。注意点として、配列1と配列2のデータ数は同じにしてください。データ数が異なると #N/A エラーになります。

基本的な使い方

実際にCORREL関数を使ってみましょう。

たとえば、あるお店で12か月分の「平均気温」と「アイスクリームの売上」を記録したとします。

 A列(月)B列(平均気温)C列(売上)
2行目1月5120
3行目2月6135
4行目3月10180
5行目4月15250
6行目5月20320
7行目6月25410
8行目7月30520
9行目8月32550
10行目9月27430
11行目10月18280
12行目11月12190
13行目12月7140

この2つのデータの相関係数を求める数式はこちらです。

=CORREL(B2:B13, C2:C13)

結果は 約0.99 になります。1にとても近い値なので、気温と売上には強い正の相関があることがわかりますね。

相関係数の読み取り方(強弱の目安表)

CORREL関数の結果が出ても「0.65って強いの?弱いの?」と迷うことがありますよね。以下の目安表を参考にしてください。

相関係数の範囲強さの目安解釈
0.7 〜 1.0強い正の相関一方が増えると、もう一方もかなり増える
0.4 〜 0.7やや正の相関一方が増えると、もう一方も増える傾向
0.2 〜 0.4弱い正の相関わずかに同じ方向に動く傾向
-0.2 〜 0.2ほぼ無相関2つのデータに関連性はほぼない
-0.4 〜 -0.2弱い負の相関わずかに逆方向に動く傾向
-0.7 〜 -0.4やや負の相関一方が増えると、もう一方は減る傾向
-1.0 〜 -0.7強い負の相関一方が増えると、もう一方はかなり減る

ビジネスの現場では 0.4以上(または-0.4以下) であれば「関連がありそうだ」と判断するケースが多いですよ。

WARNING

相関関係は因果関係ではありません。 相関係数が高いからといって、「Aが原因でBが起きている」とは限りません。たとえば「アイスの売上」と「水難事故の件数」は強い相関を示しますが、アイスが水難事故を引き起こしているわけではなく、「気温」という第三の要因が両方に影響しています。データ分析の際は、この点を常に意識してくださいね。

実務で使える活用例

活用例1: 広告費と売上の関係を分析する

マーケティング部門では「広告費を増やしたら売上は増えるのか?」という問いがよく出てきます。

月別の広告費(D列)と売上(E列)があるとして、次の数式で相関を確認できます。

=CORREL(D2:D13, E2:E13)

結果が0.7以上なら、広告投資に効果がある可能性が高いと判断できます。逆に0.2程度なら、広告費以外の要因が売上を左右していることがわかりますね。

活用例2: 複数の要因を比較して最も影響が大きいものを特定する

売上に影響しそうな要因が複数ある場合、それぞれの相関係数を並べて比較すると優先順位が見えてきます。

=CORREL(気温, 売上)    → 0.92
=CORREL(広告費, 売上)  → 0.65
=CORREL(競合価格, 売上) → -0.31

この結果なら「気温の影響が最も大きく、広告費もそこそこ影響あり、競合価格は弱い逆相関」と読み取れます。施策の優先順位づけに使えますよ。

活用例3: 在庫管理と需要予測のヒントにする

過去データで「曜日ごとの来客数」と「特定商品の販売数」の相関を調べておくと、仕入れ量の判断材料になります。相関が強いとわかれば、来客数の予測から販売数を見積もることができますよね。

散布図と組み合わせて視覚化する

CORREL関数で数値を出したら、散布図と組み合わせるとさらにわかりやすくなります。数値だけでは伝わりにくい相関の傾向も、グラフにすれば一目瞭然です。

散布図の作り方

  1. 2つのデータ列(例: B2:C13)を選択する
  2. 「挿入」タブ → 「グラフ」 → 「散布図」を選択する
  3. 点の並びが右肩上がりなら正の相関、右肩下がりなら負の相関

近似曲線を追加する

散布図上でデータ点を右クリック → 「近似曲線の追加」を選ぶと、データの傾向を直線で表示できます。「R-2乗値を表示する」にチェックを入れると、相関の強さを視覚的にも確認できますよ。

TIP

R-2乗値(R²)は相関係数を2乗した値です。CORREL関数の結果が0.9なら R²=0.81 となり、「一方のデータで他方の81%を説明できる」と解釈できます。

よくあるエラーと対処法

エラー原因対処法
#N/A配列1と配列2のデータ数が異なるセル範囲の行数を揃える
#DIV/0!データが1つしかない、またはすべて同じ値データ数を2つ以上にする。値にばらつきがあるか確認する
#VALUE!範囲内に文字列が含まれている数値以外のセルを除外するか、数値に変換する

なお、CORREL関数は数値以外のセル(空白や文字列)を自動的に無視します。ただし、一方のセルが数値で他方が空白というペアがあると、そのペアごと計算から除外される点に注意してください。

PEARSON関数との違い

ExcelにはCORRELとよく似た PEARSON関数 があります。

=PEARSON(B2:B13, C2:C13)

実は、CORREL関数とPEARSON関数はまったく同じ計算結果を返します。どちらもピアソンの積率相関係数を計算する関数で、内部の計算式も同じです。

項目CORRELPEARSON
戻り値ピアソン相関係数ピアソン相関係数
計算結果同じ同じ
対応バージョンExcel 2007〜Excel 2007〜
名前の由来Correlation(相関)Karl Pearson(統計学者)

どちらを使っても結果は同じなので、チームで統一しておけばOKです。一般的にはCORREL関数のほうが使われる頻度が高いですよ。

関連する統計関数との使い分け

CORREL関数の周辺には、データ分析で一緒に使うことの多い統計関数があります。

関数用途CORREL関数との関係
AVERAGE平均値を求める相関分析の前に各データの平均を確認する
MEDIAN中央値を求める外れ値がある場合の代表値として使う
STDEV.P / STDEV.S標準偏差を求めるデータのばらつき具合を確認する
LARGE / SMALLN番目に大きい/小さい値外れ値の特定に使う
RANK順位をつける相関分析後のランキング作成に使う
COVARIANCE.P共分散を求める相関係数の計算に使われる中間値

TIP

CORREL関数の計算式は「共分散 ÷(配列1の標準偏差 × 配列2の標準偏差)」です。COVARIANCE.P関数とSTDEV.P関数を使って手動計算することもできますが、CORREL関数を使えば一発で求められます。

まとめ

項目内容
関数名CORREL(コリレーション)
構文=CORREL(配列1, 配列2)
戻り値-1〜1 の相関係数
正の相関1に近い → 一緒に増減する
負の相関-1に近い → 逆方向に動く
無相関0に近い → 関連性なし
PEARSON関数同じ結果を返す
注意点相関関係 ≠ 因果関係

CORREL関数は引数が2つだけのシンプルな関数ですが、ビジネスデータの分析で非常に強力なツールです。まずは身近なデータ(売上と天気、広告費と問い合わせ数など)で試してみてください。散布図と組み合わせると、上司への報告資料もグッと説得力が増しますよ。

タイトルとURLをコピーしました