「この2つのデータって、本当に関係あるのかな?」「感覚じゃなくて数字で確かめたい……」
スプレッドシートでデータを扱っていると、こんなふうに思う場面がありますよね。広告費と売上、気温と来客数など、2つのデータの関連性を数値で示せたら説得力がぐっと増します。
そんなときに使えるのが PEARSON関数 です。この記事では、スプレッドシートのPEARSON関数の基本構文から相関係数の読み取り方、CORREL関数との違い、実務での活用例まで解説していきます。
スプレッドシートのPEARSON関数とは?
PEARSON関数は、2つのデータセットのピアソン積率相関係数を返す統計関数です。
- 読み方: ピアソン
- 名前の由来: 統計学者 Karl Pearson(カール・ピアソン)の名前から
- 戻り値: -1〜1 の数値
相関係数とは、2つのデータがどれくらい連動しているかを表す指標です。
- 1に近い: 一方が増えるともう一方も増える(正の相関)
- -1に近い: 一方が増えるともう一方は減る(負の相関)
- 0に近い: 2つのデータに関連性がほぼない(無相関)
たとえば「気温が上がるとアイスの売上も上がる」なら正の相関です。「気温が上がるとホットドリンクの売上は下がる」なら負の相関になりますよ。
NOTE
PEARSON関数はGoogleスプレッドシートの全バージョンで使えます。ExcelにもPEARSON関数がありますが、動作は同じです。
PEARSON関数の書き方(構文と引数)
基本構文
=PEARSON(データ1, データ2)
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| データ1 | 必須 | 比較したいデータ範囲の1つ目(例: 広告費) |
| データ2 | 必須 | 比較したいデータ範囲の2つ目(例: 売上) |
引数はたった2つだけなのでシンプルですよね。
注意点として、データ1とデータ2の要素数は同じにしてください。要素数が異なると #N/A エラーになります。
基本的な使い方
実際にPEARSON関数を使ってみましょう。ある会社の6か月分の「広告費」と「問い合わせ件数」のデータがあるとします。
| A列(月) | B列(広告費:万円) | C列(問い合わせ件数) | |
|---|---|---|---|
| 2行目 | 4月 | 30 | 45 |
| 3行目 | 5月 | 40 | 58 |
| 4行目 | 6月 | 50 | 72 |
| 5行目 | 7月 | 45 | 65 |
| 6行目 | 8月 | 60 | 88 |
| 7行目 | 9月 | 55 | 80 |
この2つのデータの相関係数を求める数式はこちらです。
=PEARSON(B2:B7, C2:C7)
結果は 約0.99 になります。1にとても近い値なので、広告費と問い合わせ件数には強い正の相関があることがわかりますね。
広告費を増やすほど問い合わせ件数も増えている傾向が、数値ではっきり確認できました。
相関係数の読み取り方(強弱の目安表)
PEARSON関数の結果を見て「0.65って強いの?弱いの?」と迷うことがありますよね。以下の目安表を参考にしてください。
| 相関係数の範囲 | 強さの目安 | 解釈 |
|---|---|---|
| 0.7 〜 1.0 | 強い正の相関 | 一方が増えると、もう一方もかなり増える |
| 0.4 〜 0.7 | やや正の相関 | 一方が増えると、もう一方も増える傾向 |
| 0.2 〜 0.4 | 弱い正の相関 | わずかに同じ方向に動く傾向 |
| -0.2 〜 0.2 | ほぼ無相関 | 2つのデータに関連性はほぼない |
| -0.4 〜 -0.2 | 弱い負の相関 | わずかに逆方向に動く傾向 |
| -0.7 〜 -0.4 | やや負の相関 | 一方が増えると、もう一方は減る傾向 |
| -1.0 〜 -0.7 | 強い負の相関 | 一方が増えると、もう一方はかなり減る |
ビジネスの現場では、0.4以上(または-0.4以下) であれば「関連がありそうだ」と判断するケースが多いですよ。
WARNING
相関関係は因果関係ではありません。 相関係数が高くても「Aが原因でBが起きている」とは限りません。たとえば「アイスの売上」と「水難事故の件数」は強い正の相関を示しますが、実際は「気温」という第三の要因が両方に影響しているだけです。分析の際はこの点を意識してくださいね。
PEARSON関数の実務活用例
活用例1: 広告チャネル別の効果を比較する
複数の広告チャネルのうち、どれが売上に最も影響しているか調べたい場面を考えてみましょう。チャネルごとにPEARSON関数で相関係数を求めて比較します。
=PEARSON(B2:B13, E2:E13) → 0.85(Web広告費 vs 売上)
=PEARSON(C2:C13, E2:E13) → 0.42(SNS広告費 vs 売上)
=PEARSON(D2:D13, E2:E13) → 0.15(チラシ配布数 vs 売上)
この結果から「Web広告の影響が最も大きい」と読み取れます。予算配分を見直すときの判断材料になりますよね。
活用例2: 散布図と組み合わせて視覚化する
PEARSON関数で相関係数を数値で出したら、散布図で視覚的にも確認するのがおすすめです。
散布図の作り方:
- 2つのデータ列(例: B2:C7)を選択する
- 「挿入」メニュー →「グラフ」を選択する
- グラフの種類で「散布図」を選ぶ
点の並びが右肩上がりなら正の相関、右肩下がりなら負の相関です。数値だけで伝わりにくい場合でも、散布図があれば一目で関連性が伝わりますよ。
活用例3: 複数KPIの関係性を整理する
営業チームで「訪問回数」「見積提出数」「成約数」の関係を分析する場面でも活躍します。
=PEARSON(訪問回数, 成約数) → 0.55
=PEARSON(見積提出数, 成約数) → 0.82
見積提出数のほうが成約数との相関が強いとわかりますよね。「訪問を増やすより見積提出率を上げよう」という施策の判断材料になります。
よくあるエラーと対処法
| エラー | 原因 | 対処法 |
|---|---|---|
#N/A | データ1とデータ2の要素数が異なる | セル範囲の行数を揃える |
#DIV/0! | データが1つしかない、またはすべて同じ値 | データを2つ以上にする。値にばらつきがあるか確認する |
#VALUE! | 範囲内に数値に変換できない文字列がある | 数値以外のセルを除外する |
PEARSON関数は、数値以外のセル(空白や文字列)を自動的に無視します。ただし、片方が数値で相手側が空白というペアがあると、そのペアごと計算から除外される点には注意してください。
TIP
「データがすべて同じ値」のケースは見落としがちです。たとえば片方の列がすべて「100」だと、標準偏差が0になり
#DIV/0!エラーが出ます。先にデータにばらつきがあるかチェックしておきましょう。
CORREL関数との違い・使い分け
スプレッドシートにはPEARSONとよく似た CORREL関数 があります。
=CORREL(B2:B7, C2:C7)
=PEARSON(B2:B7, C2:C7)
どちらもピアソン相関係数を計算する関数で、基本的に同じ結果を返します。
| 項目 | CORREL | PEARSON |
|---|---|---|
| 戻り値 | ピアソン相関係数 | ピアソン相関係数 |
| 計算結果 | 基本的に同じ | 基本的に同じ |
| 名前の由来 | Correlation(相関) | Karl Pearson(統計学者) |
| 使用頻度 | 高い | やや低い |
Googleスプレッドシートでは、両関数の計算結果に差が出ることはほぼありません。迷ったら CORREL関数を使うのがおすすめ です。CORREL関数のほうが一般的に使われていて、ネット上の情報も豊富ですよ。
CORREL関数の詳しい使い方は、以下の記事で解説しています。
関連する統計関数
PEARSON関数の周辺には、データ分析でセットで使うことの多い関数があります。
TIP
PEARSON関数の計算式は「共分散 / (データ1の標準偏差 x データ2の標準偏差)」です。STDEV関数で標準偏差を求めて手動計算もできますが、PEARSON関数なら一発で求められます。
まとめ
| 項目 | 内容 |
|---|---|
| 関数名 | PEARSON(ピアソン) |
| 構文 | =PEARSON(データ1, データ2) |
| 戻り値 | -1〜1 の相関係数 |
| 正の相関 | 1に近い → 一緒に増減する |
| 負の相関 | -1に近い → 逆方向に動く |
| 無相関 | 0に近い → 関連性なし |
| CORREL関数 | 基本的に同じ結果。迷ったらCORRELがおすすめ |
| 注意点 | 相関関係 ≠ 因果関係 |
PEARSON関数は引数が2つだけのシンプルな関数ですが、データ間の関連性を数値化できる便利なツールです。まずは身近なデータ(広告費と売上、残業時間と生産性など)で試してみてください。散布図と組み合わせると、報告資料の説得力もアップしますよ。
