「平均値も標準偏差も出したけど、データの山が尖っているのか平たいのかがわからない」。こんな場面はありませんか?
平均値やばらつきだけでは、分布の形状まではつかめません。同じ平均・同じ標準偏差でも、山がシャープに尖っている分布と、なだらかに広がっている分布があります。
そんなときに使うのがKURT関数です。この記事では基本の書き方から実務での活用例まで解説します。尖度の読み取り方やSKEW関数との組み合わせもあわせて整理しました。
KURT関数とは?データの尖度を求める関数
KURT関数(読み方: カートシス関数)は、データの尖度(せんど)を返す関数です。「KURT」は英語の「kurtosis(カートシス)」の略で、ギリシャ語の「曲がった」に由来します。
尖度とは、データの分布が正規分布と比べてどれくらい尖っているか(または平たいか)を示す統計指標です。分布の「山の形」と「裾の重さ」を1つの数値で表してくれます。
身近な例でいえば、テストの成績を考えてみましょう。大半の人が平均点の前後に密集していれば、分布は尖った山になります。逆に、高得点と低得点にばらけて平均付近が少なければ、分布は平たい形になります。
KURT関数にできることをまとめると、次のとおりです。
- データの分布が尖っているか平たいかを数値で判定する
- 外れ値が多いかどうかの目安を得る
- SKEW関数と組み合わせて分布の全体像をつかむ
NOTE
KURT関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。
KURT関数の書き方(構文と引数)
基本構文
=KURT(値1, [値2], ...)
カッコの中に、尖度を求めたいデータやセル範囲を指定します。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 値1 | 必須 | 尖度を求めたい最初の値またはセル範囲 |
| 値2, … | 任意 | 追加の値またはセル範囲。最大255個まで指定可能 |
引数にはセル参照、セル範囲、数値を直接指定できます。
TIP
セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。
尖度の計算にはデータが4個以上必要
KURT関数は超過尖度を計算します。計算の仕組み上、データが4個以上ないと結果を返せません。3個以下の場合は#DIV/0!エラーになります。
また、すべてのデータが同じ値(標準偏差が0)の場合もエラーになります。ばらつきがないデータでは尖度を計算できないためです。
NOTE
SKEW関数は3個以上で計算できますが、KURT関数は4個以上が必要です。必要なデータ数が異なるので注意してください。
KURT関数の基本的な使い方
以下のテスト成績データでKURT関数を使ってみましょう。
B2からB11に10人分のテスト成績(点)が入っているとします。
| A列(生徒) | B列(点数) | |
|---|---|---|
| 2行目 | 生徒A | 62 |
| 3行目 | 生徒B | 70 |
| 4行目 | 生徒C | 74 |
| 5行目 | 生徒D | 76 |
| 6行目 | 生徒E | 78 |
| 7行目 | 生徒F | 80 |
| 8行目 | 生徒G | 82 |
| 9行目 | 生徒H | 84 |
| 10行目 | 生徒I | 88 |
| 11行目 | 生徒J | 96 |
尖度を求める
=KURT(B2:B11)
結果は約 -0.27 です。負の値なので、正規分布よりもやや平たい分布だとわかります。
データを見ると、62点から96点まで比較的均等に散らばっていますよね。極端に突出した値がなく、なだらかに広がっている状態です。この「平たさ」を、尖度がマイナスの数値で表しています。
KURT関数の結果を読み解くポイント
正の尖度・負の尖度・ゼロ付近の意味
尖度の値は、データの分布の形を以下のように教えてくれます。
| 尖度の値 | 分布の形 | 特徴 |
|---|---|---|
| 正(0より大きい) | 尖った山 | 平均付近に集中し、裾が重い(外れ値が出やすい) |
| 負(0より小さい) | 平たい山 | 平均付近が少なく、広く散らばっている |
| ゼロ付近 | 正規分布に近い | データが正規分布と同じくらいの尖り具合 |
KURT関数は超過尖度を返します。正規分布を基準(ゼロ)として、そこからの差を数値で表すものです。正規分布そのもののデータを入れると、ゼロに近い値が返ります。
尖度の大きさの目安
もう少し細かく判断するなら、次の目安が使えます。
| 尖度の値 | 分布の特徴 |
|---|---|
| 3以上 | かなり尖っている。外れ値が多い可能性あり |
| 0〜3 | 正規分布よりやや尖っている |
| -2〜0 | 正規分布よりやや平たい |
| -2以下 | かなり平たい。データが広く散らばっている |
先ほどのテスト成績は約-0.27だったので、「正規分布よりやや平たい」と判断できます。
SKEW関数との組み合わせで分布の全体像をつかむ
尖度だけでは分布の「偏り」まではわかりません。そこで役立つのがSKEW関数(歪度)です。2つの指標を組み合わせると、分布の形を立体的に把握できます。
| 指標 | わかること | 関数 |
|---|---|---|
| 歪度(SKEW) | 分布が左右どちらに偏っているか | =SKEW(範囲) |
| 尖度(KURT) | 分布が尖っているか平たいか | =KURT(範囲) |
たとえば、同じデータに両方を適用してみましょう。
=SKEW(B2:B11)
=KURT(B2:B11)
「歪度が正で尖度も正」なら、右に偏った尖った分布です。一部の大きな外れ値が結果を引っ張っている状態なので、平均値ではなく中央値を使うのが安全です。
「歪度がほぼゼロで尖度が負」なら、左右対称だけど平たい分布です。データが幅広く散らばっている状態です。STDEV関数でばらつきの大きさも確認してみてください。
KURT関数の実務活用パターン
品質検査データのばらつき評価
製品の寸法データや検査データにKURT関数を適用すると、品質のばらつきの「形」がわかります。
=KURT(B2:B101)
尖度が大きく正の値なら、大半は規格内に収まっているものの外れ値が出やすい状態です。工程に突発的な異常が潜んでいる可能性があります。
尖度が負の値なら、規格の上限・下限に近い値が多い状態です。全体的にばらつきが大きく、工程の安定性を見直す必要があるかもしれません。
| 尖度 | 品質管理の着眼点 |
|---|---|
| 正に大きい | 外れ値を個別に調査。突発的な異常の原因を探る |
| ゼロ付近 | 正規分布に近い。通常の管理で問題なし |
| 負に大きい | ばらつきが大きい。工程全体の見直しを検討 |
TIP
AVERAGE関数とSTDEV関数で平均と標準偏差を求めてから、KURT関数で分布の形を確認する流れがおすすめです。3つの指標をセットで見ることで、データの特徴を立体的に把握できます。
分布の正規性を簡易チェックする
統計分析の多くは「データが正規分布に近い」ことを前提にしています。KURT関数とSKEW関数を組み合わせて簡易的に確認できます。
=IF(AND(ABS(SKEW(B2:B101)) < 0.5, ABS(KURT(B2:B101)) < 1), "ほぼ正規分布", "正規分布から外れている")
歪度が-0.5〜0.5、尖度が-1〜1の範囲に収まっていれば、正規分布に近いとみなせます。この範囲を大きく外れるデータでは、平均値ベースの分析だと結論がずれる可能性があります。
ダッシュボードにこの数式を組み込んでおくと、データの特性を毎回手動で確認する手間が省けますよ。
KURT関数でよくあるエラーと対処法
#DIV/0!エラー
KURT関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| 数値データが3個以下 | 4個以上の数値データを指定する |
| 範囲内に数値が含まれていない | 文字列ばかりの範囲を指定していないか確認する |
| 全データが同じ値(標準偏差が0) | ばらつきのあるデータを用意する |
尖度を計算するには最低4個の数値が必要です。また、すべて同じ値だと標準偏差が0になり、計算できません。
#VALUE!エラー
引数に文字列を直接入力すると発生します。
=KURT("100", "200", "300", "400") → #VALUE!エラー
=KURT(100, 200, 300, 400) → 正常に計算される
セル範囲内の文字列は自動で無視されます。直接引数に渡した場合のみエラーになるので注意してください。
TIP
期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。KURT関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。
まとめ
KURT関数は、データの尖度(分布の尖り具合)を返す関数です。
この記事のポイント
- 構文は
=KURT(値1, [値2], ...)で、セル範囲を指定するだけ - 尖度が正なら尖った分布(外れ値が出やすい)、負なら平たい分布
- 正規分布を基準にゼロを返す「超過尖度」の仕組み
- 計算には4個以上の数値データが必要(SKEW関数は3個以上)
- SKEW関数と組み合わせると分布の全体像がつかめる
次のステップ:関連する統計関数
KURT関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。
