ExcelのF.TEST関数の使い方|2グループの分散をF検定で比較する完全ガイド

スポンサーリンク

「2つのデータのばらつき、本当に同じくらいなのかな?」と疑問に思ったことはありませんか。平均値は近いのに、ばらつきが大きく違うと、データの信頼性も変わってきますよね。

そんなときに使えるのが、ExcelのF.TEST関数です。2グループのデータの分散が等しいかどうかを、F検定で一発で判定できる便利な関数ですよ。

本記事では、F.TEST関数の構文と引数の意味、製造ばらつき比較などの実務シナリオを解説します。t検定との組み合わせ方や、F分布関連関数(F.DIST/F.DIST.RT/F.INV/F.INV.RT)との使い分けマップも掲載します。ぜひ参考にしてくださいね。

ExcelのF.TEST関数とは?F検定の基本

ExcelのF.TEST関数は、2つのデータセットに対してF検定を行い、両側F検定のp値を返す統計関数です。読み方は「エフ・テスト」です。

「F検定」とは、2つのデータ群の分散(ばらつきの大きさ)が等しいかどうかを統計的に判定する手法のこと。t検定が「平均値の差」を見るのに対し、F検定は「ばらつきの差」を見る点が違いますね。

F検定で何がわかるのか

F検定の結果として、2グループの分散が「統計的に意味のある差を持つかどうか」を判断できます。

たとえば、製造ラインAとBで作った部品の寸法を比べたとします。平均が同じでもラインBのほうが大きくバラついていれば、品質の安定性に差があるということです。F.TEST関数を使えば、その差が偶然かどうかを数値で示してくれますよ。

t検定との違い

t検定(T.TEST)とF検定(F.TEST)はどちらも2グループのデータを比較しますが、見るポイントが違います。

比較軸T.TEST(t検定)F.TEST(F検定)
何を比べる?平均値の差分散(ばらつき)の差
使う場面「平均が違うか知りたい」「ばらつきが違うか知りたい」
戻り値p値p値
関連分布t分布F分布

実務では「F検定でばらつきを比較してから、t検定で平均を比較する」という2段階の流れがよく使われます。詳しくは後ほど解説しますね。

F.TEST関数の構文と引数

F.TEST関数の基本的な書き方はとてもシンプルです。

構文

=F.TEST(配列1, 配列2)

引数の意味

引数必須説明
配列1必須1つ目のデータ範囲(数値の配列)
配列2必須2つ目のデータ範囲(数値の配列)

引数は2つの配列だけです。F.TEST関数は内部で大きい分散を分子にとって計算するため、配列1と配列2を入れ替えても結果は変わりません。順序を気にしなくて大丈夫ですよ。

戻り値の意味

F.TEST関数が返すのは、両側F検定のp値です。p値は0以上1以下の確率値で、「2つの母分散が等しい」という帰無仮説のもとで観測された分散比が偶然起こる確率を表します。

p値の解釈は次のとおりです。

  • p値 < 0.05 → 帰無仮説を棄却(2グループの分散は有意に異なる)
  • p値 ≥ 0.05 → 帰無仮説を棄却できない(分散が異なるとは言えない)

なお、有意水準(α)は0.05が一般的ですが、より厳格に判定したい場合は0.01、緩く判定したい場合は0.10が使われます。業界や場面に応じて使い分けてくださいね。

F.TEST関数の基本的な使い方(製造ばらつき比較例)

実際にF.TEST関数を使う例を見ていきましょう。製造ラインAとBで作った部品の寸法(ミリ単位)を比較するシーンを想定します。

サンプルデータ

セルA列(ラインA)B列(ラインB)
行210.110.0
行310.010.2
行410.29.7
行59.910.5
行610.09.8
行710.110.4
行89.99.6

数式と結果

D2セルに次の数式を入れます。

=F.TEST(A2:A8, B2:B8)

結果として、p値(小数)が返ってきます。たとえば結果が「0.018」だったとします。p値は0.05未満なので「ラインAとBの分散には統計的に有意な差がある」と判断できますよ。

結果の見方

p値の判定は、有意水準と比較するだけでOKです。

  • p値 = 0.018 → 0.05未満 → 「ばらつきに有意差あり」と判断
  • p値 = 0.32 → 0.05以上 → 「ばらつきに有意差があるとは言えない」

具体的に解釈すると、ラインAは寸法が9.9〜10.2の範囲に収まっているのに対し、ラインBは9.6〜10.5まで広く散らばっています。F.TEST関数が「この差は偶然ではない」と教えてくれるわけですね。

F.TEST関数の実務活用例3つ

ここからは、F.TEST関数を実務でどう活かすか、具体的なシナリオを3つ見ていきましょう。

活用例1: 教育成果のばらつき比較

異なる指導法を試した2クラスのテスト結果を比較するケースです。クラスAは従来型の講義、クラスBは新しいアクティブラーニングを採用したとします。

クラスA(点)クラスB(点)
7580
8078
7082
8579
7881
8280

F.TEST関数で2クラスの点数のばらつきを比較してみましょう。「新しい指導法のほうが理解度が均一か(ばらつきが小さいか)」を統計的に裏付けられますよ。

=F.TEST(A2:A7, B2:B7)

p値が小さければ、平均点の差だけでなく「学習効果の安定性」に差があると言えますね。

活用例2: 販売チャネル別の売上ばらつき比較

オンラインショップと実店舗の日次売上を比較したいときに使います。

「平均は同じくらいだけど、オンラインのほうが売上が安定しているか?」を確かめるには、F.TEST関数がぴったりです。

たとえば、過去30日分の日次売上をA列(オンライン)とB列(実店舗)に入れて、次の数式を入力します。

=F.TEST(A2:A31, B2:B31)

p値が小さければ「ばらつきに有意な差がある」と判断できます。在庫管理戦略やKPI設定の根拠資料として活用できますよ。

活用例3: 装置交換前後の精度比較

工場で測定装置を新しいものに交換したとき、「交換前後で測定精度(ばらつき)が変わったか」を検証する場面です。

交換前(mm)交換後(mm)
5.025.00
4.985.01
5.055.00
4.954.99
5.035.01
=F.TEST(A2:A6, B2:B6)

p値が小さければ「測定値のばらつきが有意に変わった(=新装置のほうが安定している)」と統計的に主張できます。設備投資の効果を示す根拠データになりますね。

T.TEST関数との連携:等分散性検定からt検定への流れ

実はF.TEST関数の最大の使いどころは、t検定(T.TEST)の前段階としての「等分散性検定」です。

なぜ等分散性検定が必要か

T.TEST関数では、type引数を選ぶ必要があります。「等分散の2標本(type=2)」か「異分散の2標本(type=3)」のどちらを使うかという選択ですね。

ただ、どちらを選べばいいのか迷いますよね。そこでF.TEST関数で先に2グループの分散が等しいかを検定してから、適切なtype引数を決める流れが定石なんです。

等分散性検定→t検定のフローチャート

実際の手順は次のとおりです。

ステップ1: F.TEST(配列1, 配列2) でp値を求める
   ↓
ステップ2: F検定のp値を判定
   ・p値 ≥ 0.05 → 等分散とみなす(type=2)
   ・p値 < 0.05 → 等分散とみなさない(type=3)
   ↓
ステップ3: T.TEST(配列1, 配列2, tails, type) で平均値の検定

具体例

たとえば、A2:A11とB2:B11に2グループのデータがあるとします。

=F.TEST(A2:A11, B2:B11)

結果が「0.42」(0.05以上)だった場合は、等分散とみなしてt検定を実行します。

=T.TEST(A2:A11, B2:B11, 2, 2)

第3引数(tails)は両側検定なら「2」、第4引数(type)は等分散の2標本なら「2」です。これで2グループの平均値に有意差があるかが判定できますよ。

逆にF.TEST関数のp値が0.03(0.05未満)なら、type=3(異分散の2標本)でt検定を行います。

=T.TEST(A2:A11, B2:B11, 2, 3)

このようにF.TESTとT.TESTを組み合わせれば、統計的に正しい手順で2グループの比較ができますよ。

F.TEST関数と関連F分布関数の使い分け

F分布を扱う関数は、F.TEST以外にも複数あります。それぞれの役割を整理しておきましょう。

F分布関連関数マップ

関数機能戻り値主な用途
F.DISTF分布の累積確率(左側) or 確率密度確率値F分布のCDF/PDF計算
F.DIST.RTF分布の右側確率確率値片側F検定のp値計算
F.INVF分布の左側臨界値F値左側の境界値を求める
F.INV.RTF分布の右側臨界値F値棄却域の境界F値を求める
F.TEST両側F検定のp値p値2グループの分散比較

使い分けの判断基準

「結局どれを使えばいいの?」という方のために、目的別に整理しました。

  • 2グループの分散を直接比較したい → F.TEST(両側検定のp値が一発で出る)
  • F値からp値を求めたい(片側) → F.DIST.RT
  • 特定の有意水準での臨界F値を求めたい → F.INV.RT
  • F分布のグラフを描きたい → F.DIST(cumulative=FALSEで確率密度)

F.TEST関数は「2つのデータが手元にあるとき」に最も使いやすい関数です。F値や自由度を意識せず、配列を渡すだけでp値が返ってくるのが強みですね。

両側 vs 片側の使い分け

F.TEST関数は両側F検定のp値を返します。一方、F.DIST.RT関数を使えば片側F検定のp値も計算できますよ。

検定の種類使う関数帰無仮説対立仮説
両側F検定F.TESTσ1² = σ2²σ1² ≠ σ2²
片側F検定F.DIST.RTσ1² = σ2²σ1² > σ2²(または σ1² < σ2²)

「方向性を問わずばらつきの差を見たい」なら両側(F.TEST)です。「片方のグループのほうがばらつきが大きい/小さいと事前予想がある」なら片側(F.DIST.RT)と覚えておきましょう。

旧FTEST関数との違い

Excelには互換性関数として旧 FTEST 関数も残っています。F.TEST関数とFTEST関数は計算結果は同じですが、Microsoftは新しいF.TEST関数の使用を推奨していますよ。

新規で数式を作るときはF.TEST関数を使い、古いブックを引き継いだときだけFTEST関数を見かける、という使い分けで問題ありません。

F.TEST関数のよくあるエラーと対処法

F.TEST関数でつまずきやすいエラーをまとめます。原因と対処法を押さえておけば、迷わず解決できますよ。

#DIV/0! エラー

項目内容
原因配列1または配列2の分散が0(=全データが同じ値)
対処法データに変動があるか確認する。同じ値ばかりだとF検定は意味を持たない

たとえば配列1が「{10, 10, 10, 10}」のように全て同じ値だと、分散が0になりエラーになります。検定対象として適切でないため、データを見直しましょうね。

#N/A エラー

項目内容
原因配列1または配列2のデータ数が2未満
対処法各配列に最低2つ以上の数値データを入れる

データ数が1つ以下では分散が計算できないため、エラーになります。最低でも各配列に2つは数値を入れてくださいね。

#NUM! エラー

項目内容
原因計算過程で数値が範囲外(極端な分散比)
対処法データ値の妥当性を確認する。外れ値が混じっていないかチェックする

異常に大きい値や小さい値が混ざっていると、F値が計算可能範囲を超えてしまうことがあります。元データに入力ミスがないか確認しましょう。

#VALUE! エラー

項目内容
原因引数に文字列など数値以外が含まれる
対処法数値以外を除外する。空白セルは無視されるが文字列はエラーの原因

「未測定」などの文字列がセルに入っている場合、ISNUMBER関数でフィルタするか、IFERROR関数で代替値を入れるなどの対処を行ってくださいね。

まとめ:F検定でデータの信頼性を一段階上げる

ExcelのF.TEST関数は、2グループのデータの分散が等しいかどうかをF検定で判定し、両側p値を一発で返してくれる関数です。

要点を整理すると、次のとおりです。

  • 構文: =F.TEST(配列1, 配列2) のシンプルな形
  • 戻り値: 両側F検定のp値(0以上1以下)
  • 判定: p値 < 0.05 で「分散は有意に異なる」、p値 ≥ 0.05 で「異なるとは言えない」
  • t検定との連携: F.TESTで等分散性を確認 → T.TESTのtype引数を選択
  • 使い分け: 直接2グループ比較ならF.TEST、F値から確率を求めるならF.DIST/F.DIST.RT
  • 旧FTESTとの違い: 結果は同じだが、F.TEST(新)の使用が推奨

F検定は「データのばらつきが本当に違うのか?」を統計的に裏付ける強力な手法です。製造業の品質管理、教育効果の検証、販売チャネルの安定性比較など、活用シーンは幅広くありますよ。

t検定(T.TEST)と組み合わせれば、さらに信頼性の高いデータ分析ができます。ぜひF.TEST関数を実務で活用してみてくださいね。

タイトルとURLをコピーしました