「平均値も標準偏差も出したけど、データの山が尖っているのか平たいのかがわからない」。データ分析を進めていると、こんな場面はありませんか?
平均値やばらつきだけでは、分布の形状まではつかめません。同じ平均・同じ標準偏差でも、山がシャープに尖っている分布と、なだらかに広がっている分布があります。両者は中身がまったく違うのに、代表値だけ見ていると気づけないのです。
そんなときに使うのがKURT関数です。この記事では基本の書き方から実務での活用例、SKEW関数との組み合わせ、よくあるエラーまでを順番に解説します。読み終えるころには、KURT関数で「分布の形」を一発で読み解けるようになっているはずです。
KURT関数とは?データの尖度を求める関数
KURT関数(読み方: カートシス関数)は、データの尖度(せんど)を返す関数です。「KURT」は英語の「kurtosis(カートシス)」の略で、ギリシャ語の「曲がった」という意味の言葉に由来します。
尖度とは、データの分布が正規分布と比べてどれくらい尖っているか(または平たいか)を示す統計指標です。分布の「山の形」と「裾の重さ」を1つの数値で表してくれます。
身近な例でいえば、テストの成績を考えてみましょう。大半の人が平均点の前後に密集していれば、分布は尖った山になります。逆に、高得点と低得点にばらけて平均付近が少なければ、分布は平たい形になります。KURT関数を使えば、この「山の高さの感覚」を客観的な数字に置き換えられるのです。
KURT関数にできることをまとめると、次のとおりです。
- データの分布が尖っているか平たいかを数値で判定する
- 外れ値が出やすいデータかどうかの目安を得る
- 正規分布をどれだけ前提にしてよいかをチェックする
- SKEW関数と組み合わせて分布の全体像をつかむ
NOTE
KURT関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。Microsoft 365でもExcel 2019・2021でも結果は変わりません。
KURT関数の書き方(構文と引数)
基本構文
=KURT(値1, [値2], ...)
カッコの中に、尖度を求めたいデータやセル範囲を指定します。範囲を1つだけ渡す使い方が一般的ですが、離れた範囲を複数まとめて渡すこともできます。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 値1 | 必須 | 尖度を求めたい最初の値またはセル範囲 |
| 値2, … | 任意 | 追加の値またはセル範囲。最大255個まで指定可能 |
引数にはセル参照、セル範囲、数値の直接指定が使えます。=KURT(B2:B11) のような連続範囲だけでなく、=KURT(B2:B11, D2:D11) のように非連続な範囲も指定できます。
TIP
セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になるので、ヘッダー行や注釈が混ざっていてもエラーにはなりません。ただし、引数に文字列を直接渡すとエラーになります(後述)。
尖度の計算にはデータが4個以上必要
KURT関数は超過尖度を計算します。計算式の仕組み上、データが4個以上ないと結果を返せません。3個以下の場合は #DIV/0! エラーになります。
また、すべてのデータが同じ値(標準偏差が0)の場合もエラーになります。ばらつきがゼロのデータでは「分布」というものが存在しないため、尖度を定義できないのです。
NOTE
SKEW関数は3個以上のデータで計算できますが、KURT関数は4個以上が必要です。必要なデータ数が違うので、関数を切り替えるときは注意してください。
KURT関数の基本的な使い方
実際にデータを使ってKURT関数を試してみましょう。B2からB11に10人分のテスト成績(点)が入っているとします。
| A列(生徒) | B列(点数) | |
|---|---|---|
| 2行目 | 生徒A | 62 |
| 3行目 | 生徒B | 70 |
| 4行目 | 生徒C | 74 |
| 5行目 | 生徒D | 76 |
| 6行目 | 生徒E | 78 |
| 7行目 | 生徒F | 80 |
| 8行目 | 生徒G | 82 |
| 9行目 | 生徒H | 84 |
| 10行目 | 生徒I | 88 |
| 11行目 | 生徒J | 96 |
尖度を求める
C2セルに次の数式を入力してみてください。
=KURT(B2:B11)
結果は約 -0.27 です。負の値なので、正規分布よりもやや平たい分布だとわかります。
データを見直してみると、62点から96点まで比較的均等に散らばっていますよね。極端に突出した値もなければ、平均付近に集中しているわけでもありません。なだらかに広がっている状態を、KURT関数はマイナスの数値で表してくれているわけです。
平均・標準偏差とセットで見る
尖度だけを見るより、平均・標準偏差と並べて確認すると効果的です。
=AVERAGE(B2:B11) → 79(平均点)
=STDEV(B2:B11) → 約9.5(標準偏差)
=KURT(B2:B11) → 約-0.27(尖度)
「平均は79点、ばらつきは±9.5点ほど、分布の形は正規分布よりやや平たい」と読み解けば、データ全体のイメージがすぐつかめます。代表値・ばらつき・形状の3点セットで見るのが、データ理解の基本です。
KURT関数の結果を読み解くポイント
正の尖度・負の尖度・ゼロ付近の意味
尖度の値は、データの分布の形を以下のように教えてくれます。
| 尖度の値 | 分布の形 | 特徴 |
|---|---|---|
| 正(0より大きい) | 尖った山 | 平均付近に集中し、裾が重い(外れ値が出やすい) |
| 負(0より小さい) | 平たい山 | 平均付近が少なく、広く散らばっている |
| ゼロ付近 | 正規分布に近い | データが正規分布と同じくらいの尖り具合 |
KURT関数は超過尖度を返すのがポイントです。正規分布を基準(ゼロ)として、そこからの差を数値で表しています。「正規分布そのもの」のデータを入れるとゼロに近い値が返ってくる、という考え方を覚えておくと迷いません。
尖度の大きさの目安
もう少し細かく判断するなら、次の目安が使えます。
| 尖度の値 | 分布の特徴 | 実務での判断 |
|---|---|---|
| 3以上 | かなり尖っている | 外れ値が多い可能性大。個別調査推奨 |
| 0〜3 | 正規分布よりやや尖っている | 平均付近に集中している傾向 |
| -2〜0 | 正規分布よりやや平たい | 広く分布。標準的なばらつき |
| -2以下 | かなり平たい | データが極端に幅広く散らばっている |
先ほどのテスト成績は約-0.27だったので、「正規分布よりやや平たい」と判断できます。ぴったり正規分布ではないものの、特殊な偏りもない、ごく自然なばらつきといえます。
SKEW関数との組み合わせで分布の全体像をつかむ
尖度だけでは分布の「偏り」まではわかりません。そこで役立つのがSKEW関数(歪度)です。2つの指標を組み合わせると、分布の形を立体的に把握できます。
| 指標 | わかること | 関数 |
|---|---|---|
| 歪度(SKEW) | 分布が左右どちらに偏っているか | =SKEW(範囲) |
| 尖度(KURT) | 分布が尖っているか平たいか | =KURT(範囲) |
たとえば、同じデータに両方を適用してみましょう。
=SKEW(B2:B11)
=KURT(B2:B11)
「歪度が正で尖度も正」なら、右に偏った尖った分布です。一部の大きな外れ値が結果を引っ張っている可能性が高いので、平均値ではなく中央値(MEDIAN関数)を使うほうが安全です。
「歪度がほぼゼロで尖度が負」なら、左右対称だけど平たい分布です。データが幅広く散らばっている状態なので、STDEV関数でばらつきの大きさを併せて確認するとよいでしょう。
「歪度がほぼゼロで尖度もほぼゼロ」なら正規分布に近く、平均値ベースの分析がそのまま使えます。
KURT関数の実務活用パターン
品質検査データのばらつき評価
製品の寸法データや検査データにKURT関数を適用すると、品質のばらつきの「形」がわかります。たとえば100個分の検査結果がB列にあるとします。
=KURT(B2:B101)
尖度が大きく正の値なら、大半は規格内に収まっているものの外れ値が出やすい状態です。工程に突発的な異常が潜んでいる可能性があります。原因をたどると、特定の機械・特定の時間帯・特定の作業者に紐づくケースがよくあります。
尖度が負の値なら、規格の上限・下限に近い値が多い状態です。全体的にばらつきが大きく、工程の安定性そのものを見直す必要があるかもしれません。
| 尖度 | 品質管理の着眼点 |
|---|---|
| 正に大きい | 外れ値を個別に調査。突発的な異常の原因を探る |
| ゼロ付近 | 正規分布に近い。通常の管理で問題なし |
| 負に大きい | ばらつきが大きい。工程全体の見直しを検討 |
TIP
AVERAGE関数とSTDEV関数で平均と標準偏差を求めてから、KURT関数で分布の形を確認する流れがおすすめです。3つの指標をセットで見ることで、データの特徴を立体的に把握できます。
分布の正規性を簡易チェックする
統計分析の多くは「データが正規分布に近い」ことを前提にしています。t検定や回帰分析の前に、KURT関数とSKEW関数を組み合わせて正規性を簡易チェックする習慣をつけておくと、後の分析の信頼性が上がります。
=IF(AND(ABS(SKEW(B2:B101)) < 0.5, ABS(KURT(B2:B101)) < 1), "ほぼ正規分布", "正規分布から外れている")
歪度が-0.5〜0.5、尖度が-1〜1の範囲に収まっていれば、正規分布に近いとみなせます。この範囲を大きく外れるデータでは、平均値ベースの分析だと結論がずれる可能性があるので、中央値や四分位数(QUARTILE関数)など別の指標で補強しましょう。
ダッシュボードにこの数式を組み込んでおけば、毎回データの特性を手動で確認する手間が省けますよ。新しいデータを追加するたびに、自動で「正規分布に近いかどうか」を判定してくれる仕組みになります。
売上・アクセスログの異常検知
日々の売上データやWebアクセスログにKURT関数をかけるのも有効です。普段は安定したばらつきで推移しているはずなのに、ある期間だけ尖度が急に大きくなったとしたら、それは「突発的なスパイク」が起きているサインです。
=KURT(売上!B2:B31) → 1か月分の日次売上の尖度
キャンペーン期や障害時には、特定の日だけ極端な値になります。尖度を時系列でプロットしておけば、異常検知の早期警報として使えます。週次・月次でKURT値の推移を追うレポートを作っておくと、運用チームでの状況共有もスムーズです。
投資・金融データのリスク評価
株価のリターンや為替のボラティリティを分析するときにも、尖度はよく使われます。「ファットテール(裾の重い分布)」かどうかを見抜くための指標として有効です。
リターンの尖度が大きく正の値なら、平常時は穏やかでも、まれに大きな下落・暴騰が発生する可能性が高い、ということです。リスク管理の前提が変わるので、ポジションサイズの調整に活かせます。VAR関数やSTDEV関数と一緒に使い、ばらつきと分布形状の両面から判断するのが定番の使い方です。
KURT関数でよくあるエラーと対処法
#DIV/0!エラー
KURT関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| 数値データが3個以下 | 4個以上の数値データを指定する |
| 範囲内に数値が含まれていない | 文字列ばかりの範囲を指定していないか確認する |
| 全データが同じ値(標準偏差が0) | ばらつきのあるデータを用意する |
尖度を計算するには最低4個の数値が必要です。また、すべて同じ値だと標準偏差が0になり、計算できません。=COUNT(範囲)で数値の個数を確認したり、=STDEV(範囲)でばらつきがあるかをチェックしてから使うと、原因の切り分けがスムーズです。
#VALUE!エラー
引数に文字列を直接入力すると発生します。
=KURT("100", "200", "300", "400") → #VALUE!エラー
=KURT(100, 200, 300, 400) → 正常に計算される
セル範囲内の文字列は自動で無視されますが、引数として直接渡した場合のみエラーになります。直接数字を入力するときはダブルクォーテーションで囲まないように気をつけてください。
期待した結果にならないとき
エラーは出ないけれど「思っていた値と違う」ときは、次の3点をチェックしてみてください。
- データ件数: セル範囲内の文字列は無視されるので、想定より件数が少なくなっていないか
- 単位: 単位の違うデータが混在していないか(円とドルが混ざっていないかなど)
- 外れ値: 異常値が紛れ込んでいないか。
=MAX()・=MIN()で最大値・最小値を確認
TIP
KURT関数は外れ値の影響を強く受ける関数です。1〜2個の極端な値が結果を大きく変えることがあります。気になるときは外れ値を除外して再計算してみると、データの「本来の形」が見えてきます。
よくある質問(FAQ)
Q. KURT関数とKURTOSIS関数は違いますか?
スプレッドシートとExcelに搭載されているのはKURT関数だけで、KURTOSISという関数名はありません。プログラミング言語(Python・Rなど)ではkurtosisという名前で実装されていますが、表計算ソフトではKURTが正式名称です。
Q. 尖度がマイナスになるのはおかしくないですか?
おかしくありません。KURT関数は超過尖度を返すので、正規分布を基準(ゼロ)として、それより平たい分布はマイナスの値になります。「尖り具合」と「平たさ」を1つの数値で表現できる、便利な仕様です。
Q. データ件数が多いほど尖度の値は小さくなりますか?
件数が増えても、必ずしも値が小さくなるわけではありません。ただしサンプル数が少ないほど結果のブレが大きくなる傾向があります。30件未満のデータで判断するときは、参考値として扱うのが安全です。最低でも50件以上、可能なら100件以上で評価したほうが信頼性が高まります。
Q. KURT関数とSKEW関数はどちらを先に確認すればよいですか?
順番に決まりはありませんが、実務ではSKEW(歪度)を先に確認するパターンが多いです。「左右どちらに偏っているか」を把握してから、「分布の山の高さ」を見たほうが、現象の解釈がしやすいためです。最終的には両方セットで見るのが基本です。
Q. ExcelのKURT関数と結果は同じですか?
同じです。スプレッドシートのKURT関数とExcelのKURT関数は、同じ計算式(フィッシャーの定義による超過尖度)を使っているので、結果は一致します。Excelで作った分析資料をスプレッドシートに移しても、値が変わる心配はありません。
まとめ
KURT関数は、データの尖度(分布の尖り具合)を返す関数です。平均値や標準偏差だけではつかめない「分布の形」を、一つの数値で示してくれます。
この記事のポイント
- 構文は
=KURT(値1, [値2], ...)で、セル範囲を指定するだけ - 尖度が正なら尖った分布(外れ値が出やすい)、負なら平たい分布
- 正規分布を基準にゼロを返す「超過尖度」の仕組み
- 計算には4個以上の数値データが必要(SKEW関数は3個以上)
- SKEW関数と組み合わせると分布の全体像がつかめる
- 品質管理・正規性チェック・異常検知・金融リスク評価で活用できる
データの「形」までチェックする習慣をつけると、平均値だけでは見えない情報が拾えるようになります。次にデータを分析するときは、KURT関数を一行加えて、分布の形を読み解いてみてください。
次のステップ:関連する統計関数
KURT関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。
- スプレッドシートのSKEW関数の使い方:歪度(左右の偏り)を求める
- スプレッドシートのAVERAGE関数の使い方:平均値を求める基本関数
- スプレッドシートのMEDIAN関数の使い方:外れ値に強い中央値
- スプレッドシートのSTDEV関数の使い方:標準偏差でばらつきを把握
- スプレッドシートのSTANDARDIZE関数の使い方:データを標準化して比較
- スプレッドシートのQUARTILE関数の使い方:四分位数で分布の特徴を捉える
- スプレッドシートのVAR関数の使い方:分散でばらつきの度合いを測る
