「データのばらつきを把握したいけど、平均だけだとイマイチよくわからない」。こんな場面に遭遇したことはありませんか?
平均値だけでは、データが上位・下位にどう散らばっているかが見えませんよね。データを4つのグループに分けて分布を把握できたら便利です。
そんなときに使うのがQUARTILE関数です。この記事では基本の書き方から実務での活用例まで解説します。PERCENTILE関数やMEDIAN関数との関係もあわせて整理しました。
QUARTILE関数とは?四分位数を求める関数
QUARTILE関数(読み方: クォータイル関数)は、データを4等分したときの区切りの値(四分位数)を返す関数です。「Quartile」は英語で「四分位」という意味があります。
四分位数とは、データを小さい順に並べて4等分したときの区切りの値のことです。下から25%の位置を「第1四分位数(Q1)」と呼びます。同様に50%がQ2、75%がQ3です。
身近な例でいえば、テストの成績分布で「上位25%のラインは何点?」を求めるのがQUARTILE関数です。
QUARTILE関数にできることをまとめると、次のとおりです。
- データの四分位数(Q1・Q2・Q3)を求める
- 最小値(Q0)と最大値(Q4)も取得できる
- データの分布(ばらつき)を4分割で把握する
- 外れ値の検出に使うIQR(四分位範囲)を計算する
NOTE
QUARTILE関数はGoogleスプレッドシートの全バージョンで使えます。Excelとの互換性も問題ありません。
QUARTILE関数の書き方(構文と引数)
基本構文
=QUARTILE(データ, 四分位値)
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| データ | 必須 | 四分位数を求めたいセル範囲または配列 |
| 四分位値 | 必須 | 0〜4の整数。0=最小値、1=Q1、2=Q2、3=Q3、4=最大値 |
第2引数には0から4の整数を指定します。小数は使えません。
| 四分位値 | 意味 | 対応するパーセンタイル |
|---|---|---|
| 0 | 最小値 | 0パーセンタイル |
| 1 | 第1四分位数(Q1) | 25パーセンタイル |
| 2 | 第2四分位数(Q2 = 中央値) | 50パーセンタイル |
| 3 | 第3四分位数(Q3) | 75パーセンタイル |
| 4 | 最大値 | 100パーセンタイル |
TIP
第2引数は「0〜4の整数」だけです。5段階しかないので覚えやすいですよね。もっと細かく分布を見たい場合は、PERCENTILE関数を使ってください。
QUARTILE関数の基本的な使い方
以下の売上データでQUARTILE関数を使ってみましょう。
B2からB11に10人分の売上データが入っているとします。
| A列(担当者) | B列(売上) | |
|---|---|---|
| 2行目 | 田中 | 120 |
| 3行目 | 鈴木 | 85 |
| 4行目 | 佐藤 | 200 |
| 5行目 | 山田 | 150 |
| 6行目 | 高橋 | 95 |
| 7行目 | 伊藤 | 180 |
| 8行目 | 渡辺 | 110 |
| 9行目 | 中村 | 130 |
| 10行目 | 小林 | 160 |
| 11行目 | 加藤 | 140 |
第1四分位数(Q1)を求める
下位25%のラインを知りたいときは、第2引数に1を指定します。
=QUARTILE(B2:B11, 1)
結果は 106.25 です。売上が106.25以下なら、下位25%に入るということがわかります。
すべての四分位数を求める
第2引数を0〜4に変えて、データの分布を一覧にしてみましょう。
| 数式 | 四分位値 | 結果 | 意味 |
|---|---|---|---|
=QUARTILE(B2:B11, 0) | 0 | 85 | 最小値 |
=QUARTILE(B2:B11, 1) | 1 | 106.25 | 第1四分位数(下位25%ライン) |
=QUARTILE(B2:B11, 2) | 2 | 135 | 第2四分位数(中央値) |
=QUARTILE(B2:B11, 3) | 3 | 157.5 | 第3四分位数(上位25%ライン) |
=QUARTILE(B2:B11, 4) | 4 | 200 | 最大値 |
第2四分位数の「135」はMEDIAN関数で求めた中央値と一致します。最小値と最大値はMIN関数・MAX関数の結果と同じです。
TIP
5つの値(最小値・Q1・Q2・Q3・最大値)をまとめて五数要約と呼びます。データの分布をざっくり把握するのに便利なセットです。
計算のしくみ(線形補間)
QUARTILE関数は、データが四分位の位置にぴったり収まらないとき、前後の値から線形補間で計算します。
たとえばデータが10個でQ1を求める場合、小さい順で「10個 x 0.25 = 2.5番目」の位置を計算します。2番目(95)と3番目(110)の間を補間して、106.25という値が求まります。
ちょっとむずかしく見えますが、QUARTILE関数が自動でやってくれるので、計算方法を覚える必要はありません。
QUARTILE関数の実践的な使い方・応用例
成績のランク分けに使う
QUARTILE関数で四分位ごとのボーダーラインを求め、IFS関数と組み合わせてA〜Dランクに振り分けます。
まずボーダーラインを確認します。
=QUARTILE(B2:B11, 3) → 上位25%ライン(Aランク基準)
=QUARTILE(B2:B11, 2) → 上位50%ライン(Bランク基準)
=QUARTILE(B2:B11, 1) → 上位75%ライン(Cランク基準)
次に、IFS関数で各担当者をランク分けします。
=IFS(B2>=QUARTILE($B$2:$B$11,3), "A",
B2>=QUARTILE($B$2:$B$11,2), "B",
B2>=QUARTILE($B$2:$B$11,1), "C",
TRUE, "D")
結果は以下のようになります。
| 担当者 | 売上 | ランク |
|---|---|---|
| 田中 | 120 | C |
| 鈴木 | 85 | D |
| 佐藤 | 200 | A |
| 山田 | 150 | B |
| 高橋 | 95 | D |
| 伊藤 | 180 | A |
| 渡辺 | 110 | C |
| 中村 | 130 | C |
| 小林 | 160 | A |
| 加藤 | 140 | B |
範囲を絶対参照($B$2:$B$11)にするのを忘れずに。数式を下にコピーしても範囲がずれません。
外れ値の検出に使う(IQR法)
極端に大きい値や小さい値(外れ値)を見つけるには、IQR(四分位範囲)を使う方法が一般的です。
IQRとは、Q3からQ1を引いた値のことです。データの中央50%が収まる範囲を表します。
=QUARTILE(B2:B11, 3) - QUARTILE(B2:B11, 1)
この計算でIQR(第3四分位数 – 第1四分位数)が求まります。IQRの1.5倍を超える値を外れ値として検出できます。
=IF(OR(B2 > QUARTILE($B$2:$B$11,3) + 1.5*(QUARTILE($B$2:$B$11,3)-QUARTILE($B$2:$B$11,1)),
B2 < QUARTILE($B$2:$B$11,1) - 1.5*(QUARTILE($B$2:$B$11,3)-QUARTILE($B$2:$B$11,1))),
"外れ値", "")
数式が長くなりますが、やっていることはシンプルです。Q3とQ1の差(IQR)を求め、その1.5倍を超えたデータに「外れ値」と表示しています。
TIP
IQR法は統計学で最も基本的な外れ値検出の方法です。「Q1 – 1.5 x IQR」より小さい値と「Q3 + 1.5 x IQR」より大きい値を外れ値とみなします。
条件付き書式で四分位ごとに色分けする
データの分布を視覚的に把握したいときは、条件付き書式でセルを色分けします。
- B2:B11を選択する
- 「表示形式」→「条件付き書式」を開く
- 「カスタム数式」を選び、以下の数式を入力する
上位25%(Aランク)を緑にする場合:
=B2>=QUARTILE($B$2:$B$11, 3)
下位25%(Dランク)を赤にする場合:
=B2<=QUARTILE($B$2:$B$11, 1)
4つの色分けルールを設定すれば、データの分布がひと目でわかります。
よくあるエラーと対処法
#NUM!エラー
QUARTILE関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| 第2引数が0未満または4超 | 0〜4の整数で指定する |
| データ範囲が空(数値なし) | 数値が入った範囲を指定する |
第2引数に「5」以上の値を入れてしまうケースが多いです。QUARTILE関数は0〜4の5段階しか指定できません。
#VALUE!エラー
第2引数に文字列(例: “1”)を指定すると発生します。数値を直接入力するか、数値が入ったセルを参照してください。
TIP
第2引数に小数(例: 1.5)を指定すると、小数部分が切り捨てられて整数として扱われます。エラーにはなりませんが、意図しない結果になることがあるので注意してください。
文字列・論理値の扱い
QUARTILE関数は、データ範囲に含まれる文字列やTRUE/FALSEを自動的に無視します。エラーにはなりませんが、データ件数が想定より少なくなることがあります。
PERCENTILE関数・MEDIAN関数との関係
QUARTILE関数は、PERCENTILE関数やMEDIAN関数と密接な関係があります。使い分けを整理しましょう。
QUARTILE関数とPERCENTILE関数の関係
QUARTILE関数で求められる値は、すべてPERCENTILE関数でも求められます。
| QUARTILE関数 | 同じ結果のPERCENTILE | 意味 |
|---|---|---|
=QUARTILE(データ, 0) | =PERCENTILE(データ, 0) | 最小値 |
=QUARTILE(データ, 1) | =PERCENTILE(データ, 0.25) | 第1四分位数 |
=QUARTILE(データ, 2) | =PERCENTILE(データ, 0.5) | 第2四分位数(中央値) |
=QUARTILE(データ, 3) | =PERCENTILE(データ, 0.75) | 第3四分位数 |
=QUARTILE(データ, 4) | =PERCENTILE(データ, 1) | 最大値 |
PERCENTILE関数は0〜1の範囲で自由な位置を指定できます。QUARTILE関数は25%刻み(0/25/50/75/100)の5段階に限定されます。
つまり、PERCENTILE関数はQUARTILE関数の「上位互換」です。ただし、四分位数だけが必要なら、QUARTILE関数のほうが引数がシンプルでわかりやすいですよ。
MIN・MEDIAN・MAXとの対応
QUARTILE関数の一部の値は、専用の関数と同じ結果を返します。
| QUARTILE関数 | 同じ結果の関数 | 説明 |
|---|---|---|
=QUARTILE(データ, 0) | =MIN(データ) | 最小値 |
=QUARTILE(データ, 2) | =MEDIAN(データ) | 中央値 |
=QUARTILE(データ, 4) | =MAX(データ) | 最大値 |
最小値だけが必要ならMIN関数、中央値だけならMEDIAN関数、最大値だけならMAX関数がシンプルです。5つの値をまとめて求めたいときにQUARTILE関数が活躍します。
QUARTILE.INC / QUARTILE.EXCとの関係
スプレッドシートには、QUARTILE関数の派生版が2つあります。
| 関数 | 第2引数の範囲 | 説明 |
|---|---|---|
| QUARTILE | 0〜4 | 標準版(QUARTILE.INCと同じ動作) |
| QUARTILE.INC | 0〜4 | QUARTILEの正式名。0と4を含む |
| QUARTILE.EXC | 1〜3 | 0と4を除外する。最小値・最大値は返せない |
通常の業務ではQUARTILE関数(= QUARTILE.INC)で問題ありません。QUARTILE.EXCは統計的にはより厳密ですが、最小値と最大値を返せないため使い勝手が限られます。
まとめ
QUARTILE関数は、データを4等分したときの区切りの値(四分位数)を返す関数です。
この記事のポイント
- 構文は
=QUARTILE(データ, 四分位値)の2引数 - 第2引数は0〜4の整数(0=最小値、1=Q1、2=中央値、3=Q3、4=最大値)
- データの分布をざっくり4グループに分けて把握できる
- IQR(Q3 – Q1)で外れ値の検出にも使える
- PERCENTILE関数の「25%刻み版」。より細かく分布を見たい場合はPERCENTILE関数を使う
- QUARTILE(データ,2) = MEDIAN(データ) = 中央値
次のステップ:関連する統計関数
QUARTILE関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。
