【Excel】RSQ関数の使い方|決定係数R²で回帰分析の精度を評価する

スポンサーリンク

売上と広告費、気温とアイスの販売数、勉強時間とテストの点数。ビジネスの現場では「2つのデータの関係性がどれくらい強いのか」を数値で示したい場面が意外と多くあります。そんなときに役立つのが、Excelの RSQ関数 です。

RSQ関数は「ピアソンの積率相関係数の2乗」、つまり統計で言う 決定係数(R²) を返す関数です。回帰分析でモデルの当てはまりの良さを評価する指標として広く使われており、0〜1の値で「xがyの変動をどれだけ説明できているか」を表します。この記事では、RSQ関数の構文から実務での使いどころ、よく似たCORREL関数との違い、エラーが出たときの対処までをまとめて解説します。

RSQ関数とは?決定係数R²を一発で計算する統計関数

RSQ関数(読み方: アール・スクエア関数)は、指定した2つのデータ系列から決定係数 R² を求めるExcelの統計関数です。「R Squared(Rの2乗)」が名前の由来で、回帰分析の世界ではモデルの精度を測る代表的な指標として使われています。

決定係数 R² の意味はシンプルで、「xの変動によって、yの変動がどれだけ説明できるか」を0〜1の比率で表したものです。

  • R² = 1 に近い: xとyの関係が強く、回帰直線がデータによく当てはまっている
  • R² = 0 に近い: xとyにほとんど関係がなく、回帰直線で説明できない

例えばR²が0.85なら、「yの変動のうち約85%はxの変動で説明できる」と解釈できます。広告費(x)と売上(y)を分析してR²が0.9なら、「広告費の増減で売上の9割を説明できている、かなり精度の高いモデル」と判断できるわけです。

RSQ関数の構文と引数

RSQ関数の構文は次のとおりです。

=RSQ(既知のy, 既知のx)

引数は2つで、どちらも必須です。

引数説明
既知のy従属変数(結果側)のデータ範囲。売上、販売数、点数など「予測したい値」
既知のx独立変数(原因側)のデータ範囲。広告費、気温、勉強時間など「説明する側の値」

注意したいポイントは次の3つです。

  1. 「既知のy」と「既知のx」のデータ個数は必ず同じにする必要があります。件数がズレていると #N/A エラーになります
  2. セル範囲に 文字列・論理値・空白セル が含まれる場合、その行は無視されます(数値の0は計算対象)
  3. データが 1組しかない場合や、すべて同じ値 の場合は #DIV/0! エラーになります

RSQ関数の使い方:具体例で流れをつかむ

例1:広告費と売上の関係を評価する

A列に月次の広告費(既知のx)、B列に売上(既知のy)が入っているとします。

=RSQ(B2:B13, A2:A13)

結果が 0.87 なら、「広告費で売上の約87%を説明できる」という意味になります。経営会議で「広告予算を増やすべきか」を判断する際の、客観的な材料として使えます。

例2:気温とドリンク販売数の関係

C列に気温、D列にドリンクの販売数を入力し、

=RSQ(D2:D31, C2:C31)

このように書けば、30日分のデータから気温と販売数の決定係数が求められます。R²が0.92なら「気温で売れ行きの9割が説明できる」ので、天気予報から発注数を決めるルール作りに活かせます。

例3:勉強時間とテスト点数

=RSQ(テスト点数範囲, 勉強時間範囲)

教育データの分析にもそのまま使えます。要は 「結果の列, 原因の列」 の順で指定するだけなので、覚えてしまえば迷いません。

実務での活用シーン:どこでRSQが効いてくるか

RSQ関数は「なんとなく関係がありそう」を 数値で裏付けたい すべての場面で活躍します。代表的な使いどころを挙げておきます。

  • マーケティング効果測定: 広告費 vs 売上、SNS投稿数 vs アクセス数など、施策と成果の関連度を数値化する
  • 需要予測のベースづくり: 気温・曜日・価格などの変数が、販売数をどれだけ説明できるかを確認し、予測モデルに採用する変数を選ぶ
  • 人事・生産性分析: 労働時間 vs 成果物、研修時間 vs 評価スコアなど、施策のROIを可視化する
  • 品質管理: 設備の稼働条件 vs 不良率の関係を評価し、管理すべきパラメータを特定する
  • 回帰直線の信頼性評価: SLOPE関数やINTERCEPT関数で作った回帰直線が、どれだけ信頼できるかの「お墨付き」として使う

R²が0.7以上あれば比較的強い関係、0.4〜0.7は中程度、0.4未満は弱い関係と言われますが、分野によって基準は異なります。社内レポートに載せる際は、R²の値と合わせて 「何件のデータから計算したか」 を必ず添えるようにしましょう。データが少ないと R² は偶然高く出やすいからです。

CORREL関数・PEARSON関数との違い

RSQとよく混同されるのが CORREL関数 と PEARSON関数です。関係を整理しておきます。

関数返す値値の範囲意味
CORREL / PEARSON相関係数 r-1 〜 +1関係の 向き(正負)と強さ
RSQ決定係数 R²(= r²)0 〜 1説明力(どれだけ説明できるか)

数学的には RSQ = CORREL^2 の関係があります。つまり、CORRELの結果を2乗すればRSQと同じ値になります。

使い分けのコツはこうです。

  • 「増えると増える」「増えると減る」 という方向性を知りたい → CORRELまたはPEARSON
  • 「回帰モデルの当てはまり具合」 を評価したい → RSQ

プレゼン資料で「広告費と売上には正の相関がある(r=0.93)」と示した上で、「回帰モデルで売上の86%を説明できる(R²=0.86)」と補強する、という使い方がもっともわかりやすいと思います。関連する統計関数として、回帰直線の傾きを求める SLOPE関数、切片を求める INTERCEPT関数、予測値を返す FORECAST関数 も合わせて覚えておくと、回帰分析がExcelだけで一通り完結します。

よくあるエラーと対処法

RSQ関数でつまずきやすいエラーは主に3種類です。

#N/A エラー

「既知のy」と「既知のx」のデータ件数が揃っていないときに発生します。範囲選択をミスしていないか、片方だけに空白行が混ざっていないかを確認しましょう。

=RSQ(B2:B13, A2:A12)   → #N/A(件数が12と11で不一致)

#DIV/0! エラー

データが1組しかない、または「既知のx」「既知のy」のすべてが同じ値のときに発生します。分散が0になるため計算できない状態です。データを追加するか、そもそも変動のない指標をxに使っていないかを見直します。

#VALUE! エラー

範囲内にエラー値や、数値に変換できない文字列が含まれているときに発生します。元データを開き、#N/A や「計測不能」などの文字列が混ざっていないかチェックしてください。IFERRORで事前に除外するか、該当行を削除してから計算するのが確実です。

よくある質問

R²が高ければ必ず良いモデルと言えますか?

必ずしもそうとは言えません。R²は「xがyの変動をどれだけ説明できるか」を示しますが、「因果関係がある」ことを証明するものではありません。たとえばアイスの販売数と水難事故の件数は、どちらも気温に引っ張られて高いR²を示しますが、直接の因果関係はありません。また、変数を増やすほどR²は上昇しやすいため過学習に注意が必要です。R²はあくまで「モデルの当てはまりの良さ」を測る指標として、分析判断の材料のひとつに活用しましょう。

RSQ関数とCORREL関数は何が違いますか?

CORREL関数は相関係数 r(-1〜+1)を返し、関係の「向き(正負)と強さ」を表します。RSQ関数はその2乗である決定係数 R²(0〜1)を返し、「xがyの変動をどれだけ説明できるか」という説明力を表します。数学的には RSQ = CORREL^2 の関係があります。「増えると増える・減る」という方向を知りたいならCORREL、「回帰モデルの精度」を評価したいならRSQと使い分けましょう。

データ件数が少ない場合にR²を使う際の注意点はありますか?

データが少ないとR²は偶然高い値を示しやすいため、解釈に注意が必要です。目安として10件以下のデータでR²が高くても、統計的な信頼性は低いと考えてください。分析レポートに載せる際は「N=何件のデータで計算したか」を必ず添えるようにしましょう。より信頼性の高い分析には30件以上のデータを確保することが推奨されます。

RSQ関数で複数の変数(重回帰分析)は計算できますか?

RSQ関数は変数が2つの単回帰分析のみに対応しています。複数の変数を使った重回帰分析でR²を求めるには、Excelの「データ分析」アドインを使うか、LINEST関数を配列数式として入力する方法があります。「データ」タブ→「データ分析」→「回帰分析」を選ぶと、R²を含む詳細な統計結果を一括で確認できます。

まとめ:RSQ関数は「数字で語る」ための基礎体力

RSQ関数は、2つのデータの関係を 決定係数 R² という1つの数値に落とし込んでくれる、とても実用的な統計関数です。構文もシンプルで、=RSQ(結果, 原因) の順に範囲を指定するだけ。それだけで「このデータ、どれくらい信頼できる関係なの?」という問いに客観的な答えを返せます。

  • 構文は =RSQ(既知のy, 既知のx) の2引数
  • 返り値は0〜1の決定係数。1に近いほど回帰モデルの精度が高い
  • CORRELは「関係の向き」、RSQは「説明力」を表す。両方を併記するのがおすすめ
  • 件数ズレは #N/A、分散ゼロは #DIV/0! で止まる
  • 広告効果・需要予測・品質管理などあらゆるビジネス分析に使える

「なんとなく」から「数字で語る」へ。RSQ関数を使いこなせるようになると、Excelだけでも十分に説得力のある分析レポートが作れるようになります。まずは手元にある2列のデータで、一度R²を計算してみてください。

タイトルとURLをコピーしました