「この2つのデータ、何か関係があるのかな?」「数値で裏づけが欲しいんだけど……」
データ同士の関連性を調べたいとき、感覚だけで判断するのはちょっと心もとないですよね。そんなときに役立つのがExcelの PEARSON関数 です。
2つのデータ範囲を指定するだけで、-1〜1のピアソン相関係数を自動計算してくれます。この記事では基本的な使い方からCORREL関数との違い、散布図との組み合わせ、実務活用例まで紹介していきますね。
ExcelのPEARSON関数とは?
PEARSON関数は、2つのデータセットのピアソン積率相関係数を返す統計関数です。
- 読み方: ピアソン(Karl Pearson = 統計学者の名前に由来)
- 戻り値: -1〜1 の数値
- 対応バージョン: Excel 2007 以降 / Microsoft 365
相関係数とは、2つのデータがどれだけ連動しているかを表す指標です。たとえば「広告費が増えると売上も増える」なら正の相関、「気温が上がると暖房器具の売上が下がる」なら負の相関になります。
TIP
相関係数は「2つのデータが一緒に動くかどうか」を見る指標です。1に近いほど同じ方向に動き、-1に近いほど逆方向に動きます。0に近いと関連性がほとんどありません。
PEARSON関数の書き方(構文と引数)
基本構文
=PEARSON(配列1, 配列2)
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 配列1 | 必須 | 比較したいデータ範囲の1つ目(例: 広告費) |
| 配列2 | 必須 | 比較したいデータ範囲の2つ目(例: 売上) |
引数はたった2つだけなのでシンプルですよね。注意点として、配列1と配列2のデータ数は同じにしてください。データ数が異なると #N/A エラーになります。
基本的な使い方
実際にPEARSON関数を使ってみましょう。
たとえば、ある会社の12か月分の「広告費」と「問い合わせ件数」を記録したとします。
| A列(月) | B列(広告費:万円) | C列(問い合わせ件数) | |
|---|---|---|---|
| 2行目 | 1月 | 30 | 45 |
| 3行目 | 2月 | 25 | 38 |
| 4行目 | 3月 | 40 | 62 |
| 5行目 | 4月 | 50 | 78 |
| 6行目 | 5月 | 45 | 70 |
| 7行目 | 6月 | 60 | 95 |
| 8行目 | 7月 | 55 | 85 |
| 9行目 | 8月 | 35 | 52 |
| 10行目 | 9月 | 65 | 100 |
| 11行目 | 10月 | 70 | 110 |
| 12行目 | 11月 | 50 | 75 |
| 13行目 | 12月 | 45 | 68 |
この2つのデータの相関係数を求める数式はこちらです。
=PEARSON(B2:B13, C2:C13)
結果は 約0.99 になります。1にとても近い値なので、広告費と問い合わせ件数には強い正の相関があることがわかりますね。
相関係数の読み取り方(強弱の目安表)
PEARSON関数の結果が出ても「0.65って強いの?弱いの?」と迷うことがありますよね。以下の目安表を参考にしてください。
| 相関係数の範囲 | 強さの目安 | 解釈 |
|---|---|---|
| 0.7 〜 1.0 | 強い正の相関 | 一方が増えると、もう一方もかなり増える |
| 0.4 〜 0.7 | やや正の相関 | 一方が増えると、もう一方も増える傾向 |
| 0.2 〜 0.4 | 弱い正の相関 | わずかに同じ方向に動く傾向 |
| -0.2 〜 0.2 | ほぼ無相関 | 2つのデータに関連性はほぼない |
| -0.4 〜 -0.2 | 弱い負の相関 | わずかに逆方向に動く傾向 |
| -0.7 〜 -0.4 | やや負の相関 | 一方が増えると、もう一方は減る傾向 |
| -1.0 〜 -0.7 | 強い負の相関 | 一方が増えると、もう一方はかなり減る |
ビジネスの現場では 0.4以上(または-0.4以下) であれば「関連がありそうだ」と判断するケースが多いですよ。
WARNING
相関関係は因果関係ではありません。 相関係数が高いからといって、「Aが原因でBが起きている」とは限りません。たとえば「アイスの売上」と「水難事故の件数」は強い相関を示します。しかし実際は「気温」という第三の要因が両方に影響しているだけです。分析の際はこの点を常に意識してくださいね。
PEARSON関数の実務活用例
活用例1: 広告チャネル別の効果を比較する
どの広告チャネルが売上に最も影響しているか知りたいことってありますよね。チャネルごとにPEARSON関数で相関係数を並べると判断しやすくなります。
=PEARSON(Web広告費, 売上) → 0.85
=PEARSON(SNS広告費, 売上) → 0.42
=PEARSON(チラシ配布数, 売上) → 0.18
この結果なら「Web広告の影響が最も大きく、SNSもやや関連あり、チラシはほぼ無関係」と読み取れます。予算配分の判断材料になりますよね。
活用例2: 複数KPIの関係性を数値化する
営業チームで「訪問回数」「見積提出数」「成約数」の関係を可視化する場合にも使えます。
=PEARSON(訪問回数, 成約数) → 0.55
=PEARSON(見積提出数, 成約数) → 0.82
見積提出数のほうが成約数との相関が強いとわかります。「訪問回数を増やすより見積提出率を上げよう」という判断ができますね。
活用例3: 在庫管理のヒントにする
過去データで「曜日ごとの来客数」と「特定商品の販売数」の相関を調べておくと、仕入れ量の参考になります。相関が強いとわかれば、来客数の予測から販売数を見積もることができますよ。
散布図と組み合わせて視覚化する
PEARSON関数で数値を出したら、散布図と組み合わせるとさらにわかりやすくなります。数値だけでは伝わりにくい相関の傾向も、グラフにすれば一目瞭然です。
散布図の作り方
- 2つのデータ列(例: B2:C13)を選択する
- 「挿入」タブ →「グラフ」→「散布図」を選択する
- 点の並びが右肩上がりなら正の相関、右肩下がりなら負の相関
近似曲線で相関を視覚的に確認する
散布図上でデータ点を右クリック →「近似曲線の追加」を選ぶと、データの傾向を直線で表示できます。「R-2乗値を表示する」にチェックを入れると、説明力の指標を視覚的にも確認できますよ。
TIP
R-2乗値(R²)は相関係数を2乗した値です。PEARSON関数の結果が0.9なら R²=0.81 となり、「一方のデータで他方の変動の81%を説明できる」と解釈できます。Excelの RSQ関数 を使えば、R²の値を直接求めることもできます。
よくあるエラーと対処法
| エラー | 原因 | 対処法 |
|---|---|---|
#N/A | 配列1と配列2のデータ数が異なる | セル範囲の行数を揃える |
#DIV/0! | データが1つしかない、またはすべて同じ値 | データ数を2つ以上にする。値にばらつきがあるか確認する |
#VALUE! | 範囲内に文字列が含まれている | 数値以外のセルを除外するか、数値に変換する |
なお、PEARSON関数は数値以外のセル(空白や文字列)を自動的に無視します。ただし、一方のセルが数値で他方が空白というペアがあると、そのペアごと計算から除外される点に注意してください。
NOTE
「データがすべて同じ値」のケースは意外と見落としがちです。たとえば片方の列がすべて「100」だと、標準偏差が0になり
#DIV/0!エラーが出ます。値にばらつきがあるかを先にチェックしましょう。
CORREL関数との違い・使い分け
ExcelにはPEARSONとよく似た CORREL関数 があります。
=CORREL(B2:B13, C2:C13)
=PEARSON(B2:B13, C2:C13)
どちらもピアソン相関係数を計算する関数で、基本的に同じ結果を返します。ただし、内部の計算アルゴリズムに微妙な違いがあります。
| 項目 | CORREL | PEARSON |
|---|---|---|
| 戻り値 | ピアソン相関係数 | ピアソン相関係数 |
| 計算結果 | 基本的に同じ | 基本的に同じ |
| 計算方式 | 2パス方式(平均を先に計算) | 1パス方式 |
| 精度の傾向 | 浮動小数点誤差がやや少ない | 極端なデータで誤差がわずかに出る場合がある |
| 対応バージョン | Excel 2007〜 | Excel 2007〜 |
| 名前の由来 | Correlation(相関) | Karl Pearson(統計学者) |
通常の業務データでは差が出ることはほぼありません。迷ったら CORREL関数を使うのがおすすめ です。一般的にCORRELのほうが使用頻度が高く、情報も豊富です。
CORREL関数の詳しい使い方は以下の記事で解説しています。あわせてチェックしてみてくださいね。
NOTE
両関数が異なる値を返すケースはごくまれです。天文学的に大きい値や極小値を含むデータで発生する可能性があります。一般的な業務データでは気にする必要はありません。
関連する統計関数との使い分け
PEARSON関数の周辺には、データ分析で一緒に使うことの多い統計関数があります。
| 関数 | 用途 | PEARSON関数との関係 |
|---|---|---|
| CORREL | 相関係数を求める | 同じ計算結果を返す姉妹関数 |
| RSQ | 決定係数(R²)を求める | 相関係数を2乗した値。説明力の指標 |
| SLOPE | 回帰直線の傾きを求める | 相関がある場合の「増減の割合」を示す |
| INTERCEPT | 回帰直線の切片を求める | SLOPEとセットで予測式を作成する |
| COVARIANCE.P | 共分散を求める | 相関係数の計算に使われる中間値 |
| COVARIANCE.S | 共分散(標本)を求める | 標本データの場合に使用 |
TIP
PEARSON関数の計算式は「共分散 / (配列1の標準偏差 x 配列2の標準偏差)」です。COVARIANCE.P関数とSTDEV.P関数を使って手動計算もできますが、PEARSON関数を使えば一発で求められます。
まとめ
| 項目 | 内容 |
|---|---|
| 関数名 | PEARSON(ピアソン) |
| 構文 | =PEARSON(配列1, 配列2) |
| 戻り値 | -1〜1 の相関係数 |
| 正の相関 | 1に近い → 一緒に増減する |
| 負の相関 | -1に近い → 逆方向に動く |
| 無相関 | 0に近い → 関連性なし |
| CORREL関数 | 基本的に同じ結果。迷ったらCORRELがおすすめ |
| 注意点 | 相関関係 ≠ 因果関係 |
PEARSON関数は引数が2つだけのシンプルな関数ですが、データ間の関連性を数値化できる強力なツールです。まずは身近なデータ(広告費と売上、残業時間と生産性など)で試してみてください。散布図と組み合わせると報告資料の説得力がグッと増しますよ。
