スプレッドシートのKURT関数の使い方|尖度

スポンサーリンク

「平均値も標準偏差も出したけど、データの山が尖っているのか平たいのかがわからない」。こんな場面はありませんか?

平均値やばらつきだけでは、分布の形状まではつかめません。同じ平均・同じ標準偏差でも、山がシャープに尖っている分布と、なだらかに広がっている分布があります。

そんなときに使うのがKURT関数です。この記事では基本の書き方から実務での活用例まで解説します。尖度の読み取り方やSKEW関数との組み合わせもあわせて整理しました。

KURT関数とは?データの尖度を求める関数

KURT関数(読み方: カートシス関数)は、データの尖度(せんど)を返す関数です。「KURT」は英語の「kurtosis(カートシス)」の略で、ギリシャ語の「曲がった」に由来します。

尖度とは、データの分布が正規分布と比べてどれくらい尖っているか(または平たいか)を示す統計指標です。分布の「山の形」と「裾の重さ」を1つの数値で表してくれます。

身近な例でいえば、テストの成績を考えてみましょう。大半の人が平均点の前後に密集していれば、分布は尖った山になります。逆に、高得点と低得点にばらけて平均付近が少なければ、分布は平たい形になります。

KURT関数にできることをまとめると、次のとおりです。

  • データの分布が尖っているか平たいかを数値で判定する
  • 外れ値が多いかどうかの目安を得る
  • SKEW関数と組み合わせて分布の全体像をつかむ

NOTE

KURT関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。

KURT関数の書き方(構文と引数)

基本構文

=KURT(値1, [値2], ...)

カッコの中に、尖度を求めたいデータやセル範囲を指定します。

引数の説明

引数必須/任意説明
値1必須尖度を求めたい最初の値またはセル範囲
値2, …任意追加の値またはセル範囲。最大255個まで指定可能

引数にはセル参照、セル範囲、数値を直接指定できます。

TIP

セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。

尖度の計算にはデータが4個以上必要

KURT関数は超過尖度を計算します。計算の仕組み上、データが4個以上ないと結果を返せません。3個以下の場合は#DIV/0!エラーになります。

また、すべてのデータが同じ値(標準偏差が0)の場合もエラーになります。ばらつきがないデータでは尖度を計算できないためです。

NOTE

SKEW関数は3個以上で計算できますが、KURT関数は4個以上が必要です。必要なデータ数が異なるので注意してください。

KURT関数の基本的な使い方

以下のテスト成績データでKURT関数を使ってみましょう。

B2からB11に10人分のテスト成績(点)が入っているとします。

 A列(生徒)B列(点数)
2行目生徒A62
3行目生徒B70
4行目生徒C74
5行目生徒D76
6行目生徒E78
7行目生徒F80
8行目生徒G82
9行目生徒H84
10行目生徒I88
11行目生徒J96

尖度を求める

=KURT(B2:B11)

結果は約 -0.27 です。負の値なので、正規分布よりもやや平たい分布だとわかります。

データを見ると、62点から96点まで比較的均等に散らばっていますよね。極端に突出した値がなく、なだらかに広がっている状態です。この「平たさ」を、尖度がマイナスの数値で表しています。

KURT関数の結果を読み解くポイント

正の尖度・負の尖度・ゼロ付近の意味

尖度の値は、データの分布の形を以下のように教えてくれます。

尖度の値分布の形特徴
正(0より大きい)尖った山平均付近に集中し、裾が重い(外れ値が出やすい)
負(0より小さい)平たい山平均付近が少なく、広く散らばっている
ゼロ付近正規分布に近いデータが正規分布と同じくらいの尖り具合

KURT関数は超過尖度を返します。正規分布を基準(ゼロ)として、そこからの差を数値で表すものです。正規分布そのもののデータを入れると、ゼロに近い値が返ります。

尖度の大きさの目安

もう少し細かく判断するなら、次の目安が使えます。

尖度の値分布の特徴
3以上かなり尖っている。外れ値が多い可能性あり
0〜3正規分布よりやや尖っている
-2〜0正規分布よりやや平たい
-2以下かなり平たい。データが広く散らばっている

先ほどのテスト成績は約-0.27だったので、「正規分布よりやや平たい」と判断できます。

SKEW関数との組み合わせで分布の全体像をつかむ

尖度だけでは分布の「偏り」まではわかりません。そこで役立つのがSKEW関数(歪度)です。2つの指標を組み合わせると、分布の形を立体的に把握できます。

指標わかること関数
歪度(SKEW)分布が左右どちらに偏っているか=SKEW(範囲)
尖度(KURT)分布が尖っているか平たいか=KURT(範囲)

たとえば、同じデータに両方を適用してみましょう。

=SKEW(B2:B11)
=KURT(B2:B11)

「歪度が正で尖度も正」なら、右に偏った尖った分布です。一部の大きな外れ値が結果を引っ張っている状態なので、平均値ではなく中央値を使うのが安全です。

「歪度がほぼゼロで尖度が負」なら、左右対称だけど平たい分布です。データが幅広く散らばっている状態です。STDEV関数でばらつきの大きさも確認してみてください。

KURT関数の実務活用パターン

品質検査データのばらつき評価

製品の寸法データや検査データにKURT関数を適用すると、品質のばらつきの「形」がわかります。

=KURT(B2:B101)

尖度が大きく正の値なら、大半は規格内に収まっているものの外れ値が出やすい状態です。工程に突発的な異常が潜んでいる可能性があります。

尖度が負の値なら、規格の上限・下限に近い値が多い状態です。全体的にばらつきが大きく、工程の安定性を見直す必要があるかもしれません。

尖度品質管理の着眼点
正に大きい外れ値を個別に調査。突発的な異常の原因を探る
ゼロ付近正規分布に近い。通常の管理で問題なし
負に大きいばらつきが大きい。工程全体の見直しを検討

TIP

AVERAGE関数STDEV関数で平均と標準偏差を求めてから、KURT関数で分布の形を確認する流れがおすすめです。3つの指標をセットで見ることで、データの特徴を立体的に把握できます。

分布の正規性を簡易チェックする

統計分析の多くは「データが正規分布に近い」ことを前提にしています。KURT関数とSKEW関数を組み合わせて簡易的に確認できます。

=IF(AND(ABS(SKEW(B2:B101)) < 0.5, ABS(KURT(B2:B101)) < 1), "ほぼ正規分布", "正規分布から外れている")

歪度が-0.5〜0.5、尖度が-1〜1の範囲に収まっていれば、正規分布に近いとみなせます。この範囲を大きく外れるデータでは、平均値ベースの分析だと結論がずれる可能性があります。

ダッシュボードにこの数式を組み込んでおくと、データの特性を毎回手動で確認する手間が省けますよ。

KURT関数でよくあるエラーと対処法

#DIV/0!エラー

KURT関数で最もよく見るエラーです。以下の原因が考えられます。

原因対策
数値データが3個以下4個以上の数値データを指定する
範囲内に数値が含まれていない文字列ばかりの範囲を指定していないか確認する
全データが同じ値(標準偏差が0)ばらつきのあるデータを用意する

尖度を計算するには最低4個の数値が必要です。また、すべて同じ値だと標準偏差が0になり、計算できません。

#VALUE!エラー

引数に文字列を直接入力すると発生します。

=KURT("100", "200", "300", "400")   → #VALUE!エラー
=KURT(100, 200, 300, 400)            → 正常に計算される

セル範囲内の文字列は自動で無視されます。直接引数に渡した場合のみエラーになるので注意してください。

TIP

期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。KURT関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。

まとめ

KURT関数は、データの尖度(分布の尖り具合)を返す関数です。

この記事のポイント

  • 構文は =KURT(値1, [値2], ...) で、セル範囲を指定するだけ
  • 尖度が正なら尖った分布(外れ値が出やすい)、負なら平たい分布
  • 正規分布を基準にゼロを返す「超過尖度」の仕組み
  • 計算には4個以上の数値データが必要(SKEW関数は3個以上)
  • SKEW関数と組み合わせると分布の全体像がつかめる

次のステップ:関連する統計関数

KURT関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。

タイトルとURLをコピーしました