スプレッドシートのQUARTILE関数の使い方|四分位数でデータの分布をつかむ方法

スポンサーリンク

「データのばらつきを把握したいけど、平均だけだとイマイチよくわからない」。こんな場面に遭遇したことはありませんか?

平均値だけでは、データが上位・下位にどう散らばっているかが見えませんよね。データを4つのグループに分けて分布を把握できたら便利です。

そんなときに使うのがQUARTILE関数です。この記事では基本の書き方から実務での活用例まで解説します。PERCENTILE関数やMEDIAN関数との関係もあわせて整理しました。

QUARTILE関数とは?四分位数を求める関数

QUARTILE関数(読み方: クォータイル関数)は、データを4等分したときの区切りの値(四分位数)を返す関数です。「Quartile」は英語で「四分位」という意味があります。

四分位数とは、データを小さい順に並べて4等分したときの区切りの値のことです。下から25%の位置を「第1四分位数(Q1)」と呼びます。同様に50%がQ2、75%がQ3です。

身近な例でいえば、テストの成績分布で「上位25%のラインは何点?」を求めるのがQUARTILE関数です。

QUARTILE関数にできることをまとめると、次のとおりです。

  • データの四分位数(Q1・Q2・Q3)を求める
  • 最小値(Q0)と最大値(Q4)も取得できる
  • データの分布(ばらつき)を4分割で把握する
  • 外れ値の検出に使うIQR(四分位範囲)を計算する

NOTE

QUARTILE関数はGoogleスプレッドシートの全バージョンで使えます。Excelとの互換性も問題ありません。

QUARTILE関数の書き方(構文と引数)

基本構文

=QUARTILE(データ, 四分位値)

引数の説明

引数必須/任意説明
データ必須四分位数を求めたいセル範囲または配列
四分位値必須0〜4の整数。0=最小値、1=Q1、2=Q2、3=Q3、4=最大値

第2引数には0から4の整数を指定します。小数は使えません。

四分位値意味対応するパーセンタイル
0最小値0パーセンタイル
1第1四分位数(Q1)25パーセンタイル
2第2四分位数(Q2 = 中央値)50パーセンタイル
3第3四分位数(Q3)75パーセンタイル
4最大値100パーセンタイル

TIP

第2引数は「0〜4の整数」だけです。5段階しかないので覚えやすいですよね。もっと細かく分布を見たい場合は、PERCENTILE関数を使ってください。

QUARTILE関数の基本的な使い方

以下の売上データでQUARTILE関数を使ってみましょう。

B2からB11に10人分の売上データが入っているとします。

 A列(担当者)B列(売上)
2行目田中120
3行目鈴木85
4行目佐藤200
5行目山田150
6行目高橋95
7行目伊藤180
8行目渡辺110
9行目中村130
10行目小林160
11行目加藤140

第1四分位数(Q1)を求める

下位25%のラインを知りたいときは、第2引数に1を指定します。

=QUARTILE(B2:B11, 1)

結果は 106.25 です。売上が106.25以下なら、下位25%に入るということがわかります。

すべての四分位数を求める

第2引数を0〜4に変えて、データの分布を一覧にしてみましょう。

数式四分位値結果意味
=QUARTILE(B2:B11, 0)085最小値
=QUARTILE(B2:B11, 1)1106.25第1四分位数(下位25%ライン)
=QUARTILE(B2:B11, 2)2135第2四分位数(中央値)
=QUARTILE(B2:B11, 3)3157.5第3四分位数(上位25%ライン)
=QUARTILE(B2:B11, 4)4200最大値

第2四分位数の「135」はMEDIAN関数で求めた中央値と一致します。最小値と最大値はMIN関数MAX関数の結果と同じです。

TIP

5つの値(最小値・Q1・Q2・Q3・最大値)をまとめて五数要約と呼びます。データの分布をざっくり把握するのに便利なセットです。

計算のしくみ(線形補間)

QUARTILE関数は、データが四分位の位置にぴったり収まらないとき、前後の値から線形補間で計算します。

たとえばデータが10個でQ1を求める場合、小さい順で「10個 x 0.25 = 2.5番目」の位置を計算します。2番目(95)と3番目(110)の間を補間して、106.25という値が求まります。

ちょっとむずかしく見えますが、QUARTILE関数が自動でやってくれるので、計算方法を覚える必要はありません。

QUARTILE関数の実践的な使い方・応用例

成績のランク分けに使う

QUARTILE関数で四分位ごとのボーダーラインを求め、IFS関数と組み合わせてA〜Dランクに振り分けます。

まずボーダーラインを確認します。

=QUARTILE(B2:B11, 3)   → 上位25%ライン(Aランク基準)
=QUARTILE(B2:B11, 2)   → 上位50%ライン(Bランク基準)
=QUARTILE(B2:B11, 1)   → 上位75%ライン(Cランク基準)

次に、IFS関数で各担当者をランク分けします。

=IFS(B2>=QUARTILE($B$2:$B$11,3), "A",
     B2>=QUARTILE($B$2:$B$11,2), "B",
     B2>=QUARTILE($B$2:$B$11,1), "C",
     TRUE, "D")

結果は以下のようになります。

担当者売上ランク
田中120C
鈴木85D
佐藤200A
山田150B
高橋95D
伊藤180A
渡辺110C
中村130C
小林160A
加藤140B

範囲を絶対参照($B$2:$B$11)にするのを忘れずに。数式を下にコピーしても範囲がずれません。

外れ値の検出に使う(IQR法)

極端に大きい値や小さい値(外れ値)を見つけるには、IQR(四分位範囲)を使う方法が一般的です。

IQRとは、Q3からQ1を引いた値のことです。データの中央50%が収まる範囲を表します。

=QUARTILE(B2:B11, 3) - QUARTILE(B2:B11, 1)

この計算でIQR(第3四分位数 – 第1四分位数)が求まります。IQRの1.5倍を超える値を外れ値として検出できます。

=IF(OR(B2 > QUARTILE($B$2:$B$11,3) + 1.5*(QUARTILE($B$2:$B$11,3)-QUARTILE($B$2:$B$11,1)),
       B2 < QUARTILE($B$2:$B$11,1) - 1.5*(QUARTILE($B$2:$B$11,3)-QUARTILE($B$2:$B$11,1))),
   "外れ値", "")

数式が長くなりますが、やっていることはシンプルです。Q3とQ1の差(IQR)を求め、その1.5倍を超えたデータに「外れ値」と表示しています。

TIP

IQR法は統計学で最も基本的な外れ値検出の方法です。「Q1 – 1.5 x IQR」より小さい値と「Q3 + 1.5 x IQR」より大きい値を外れ値とみなします。

条件付き書式で四分位ごとに色分けする

データの分布を視覚的に把握したいときは、条件付き書式でセルを色分けします。

  1. B2:B11を選択する
  2. 「表示形式」→「条件付き書式」を開く
  3. 「カスタム数式」を選び、以下の数式を入力する

上位25%(Aランク)を緑にする場合:

=B2>=QUARTILE($B$2:$B$11, 3)

下位25%(Dランク)を赤にする場合:

=B2<=QUARTILE($B$2:$B$11, 1)

4つの色分けルールを設定すれば、データの分布がひと目でわかります。

よくあるエラーと対処法

#NUM!エラー

QUARTILE関数で最もよく見るエラーです。以下の原因が考えられます。

原因対策
第2引数が0未満または4超0〜4の整数で指定する
データ範囲が空(数値なし)数値が入った範囲を指定する

第2引数に「5」以上の値を入れてしまうケースが多いです。QUARTILE関数は0〜4の5段階しか指定できません。

#VALUE!エラー

第2引数に文字列(例: “1”)を指定すると発生します。数値を直接入力するか、数値が入ったセルを参照してください。

TIP

第2引数に小数(例: 1.5)を指定すると、小数部分が切り捨てられて整数として扱われます。エラーにはなりませんが、意図しない結果になることがあるので注意してください。

文字列・論理値の扱い

QUARTILE関数は、データ範囲に含まれる文字列やTRUE/FALSEを自動的に無視します。エラーにはなりませんが、データ件数が想定より少なくなることがあります。

PERCENTILE関数・MEDIAN関数との関係

QUARTILE関数は、PERCENTILE関数やMEDIAN関数と密接な関係があります。使い分けを整理しましょう。

QUARTILE関数とPERCENTILE関数の関係

QUARTILE関数で求められる値は、すべてPERCENTILE関数でも求められます。

QUARTILE関数同じ結果のPERCENTILE意味
=QUARTILE(データ, 0)=PERCENTILE(データ, 0)最小値
=QUARTILE(データ, 1)=PERCENTILE(データ, 0.25)第1四分位数
=QUARTILE(データ, 2)=PERCENTILE(データ, 0.5)第2四分位数(中央値)
=QUARTILE(データ, 3)=PERCENTILE(データ, 0.75)第3四分位数
=QUARTILE(データ, 4)=PERCENTILE(データ, 1)最大値

PERCENTILE関数は0〜1の範囲で自由な位置を指定できます。QUARTILE関数は25%刻み(0/25/50/75/100)の5段階に限定されます。

つまり、PERCENTILE関数はQUARTILE関数の「上位互換」です。ただし、四分位数だけが必要なら、QUARTILE関数のほうが引数がシンプルでわかりやすいですよ。

MIN・MEDIAN・MAXとの対応

QUARTILE関数の一部の値は、専用の関数と同じ結果を返します。

QUARTILE関数同じ結果の関数説明
=QUARTILE(データ, 0)=MIN(データ)最小値
=QUARTILE(データ, 2)=MEDIAN(データ)中央値
=QUARTILE(データ, 4)=MAX(データ)最大値

最小値だけが必要ならMIN関数、中央値だけならMEDIAN関数、最大値だけならMAX関数がシンプルです。5つの値をまとめて求めたいときにQUARTILE関数が活躍します。

QUARTILE.INC / QUARTILE.EXCとの関係

スプレッドシートには、QUARTILE関数の派生版が2つあります。

関数第2引数の範囲説明
QUARTILE0〜4標準版(QUARTILE.INCと同じ動作)
QUARTILE.INC0〜4QUARTILEの正式名。0と4を含む
QUARTILE.EXC1〜30と4を除外する。最小値・最大値は返せない

通常の業務ではQUARTILE関数(= QUARTILE.INC)で問題ありません。QUARTILE.EXCは統計的にはより厳密ですが、最小値と最大値を返せないため使い勝手が限られます。

まとめ

QUARTILE関数は、データを4等分したときの区切りの値(四分位数)を返す関数です。

この記事のポイント

  • 構文は =QUARTILE(データ, 四分位値) の2引数
  • 第2引数は0〜4の整数(0=最小値、1=Q1、2=中央値、3=Q3、4=最大値)
  • データの分布をざっくり4グループに分けて把握できる
  • IQR(Q3 – Q1)で外れ値の検出にも使える
  • PERCENTILE関数の「25%刻み版」。より細かく分布を見たい場合はPERCENTILE関数を使う
  • QUARTILE(データ,2) = MEDIAN(データ) = 中央値

次のステップ:関連する統計関数

QUARTILE関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。

タイトルとURLをコピーしました