「売上データの平均値は出したけど、データがどっちかに偏っていないか気になる」。こんな場面はありませんか?
平均値だけでは、データが左右対称に分布しているかわかりません。偏りがあると平均値が代表値としてあてにならないこともあります。
そんなときに使うのがSKEW関数です。この記事では基本の書き方から実務での活用例まで解説します。歪度の読み取り方やSKEW.P関数との違いもあわせて整理しました。
SKEW関数とは?データの歪度を求める関数
SKEW関数(読み方: スキュー関数)は、データの歪度(わいど)を返す関数です。「SKEW」は英語で「歪み・偏り」を意味します。
歪度とは、データの分布が左右対称からどれくらいずれているかを示す統計指標です。平均値と中央値のずれ具合を1つの数値で把握できます。
身近な例でいえば、チームの売上データを考えてみましょう。全員が平均前後に集まっていれば歪度はゼロに近くなります。一方、大半は低めで一部のトップ営業だけ突出しているなら、正の歪度になります。
SKEW関数にできることをまとめると、次のとおりです。
NOTE
SKEW関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。
SKEW関数の書き方(構文と引数)
基本構文
=SKEW(値1, [値2], ...)
カッコの中に、歪度を求めたいデータやセル範囲を指定します。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 値1 | 必須 | 歪度を求めたい最初の値またはセル範囲 |
| 値2, … | 任意 | 追加の値またはセル範囲。最大255個まで指定可能 |
引数にはセル参照、セル範囲、数値を直接指定できます。
TIP
セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。
歪度の計算にはデータが3個以上必要
SKEW関数は標本歪度を計算します。計算の仕組み上、データが3個以上ないと結果を返せません。2個以下の場合は#DIV/0!エラーになります。
また、すべてのデータが同じ値(標準偏差が0)の場合もエラーになります。ばらつきがないデータでは「偏り」を計算できないためです。
SKEW関数の基本的な使い方
以下の売上データでSKEW関数を使ってみましょう。
B2からB11に10人分の月間売上データ(万円)が入っているとします。
| A列(担当者) | B列(売上) | |
|---|---|---|
| 2行目 | 田中 | 80 |
| 3行目 | 鈴木 | 85 |
| 4行目 | 佐藤 | 90 |
| 5行目 | 山田 | 95 |
| 6行目 | 高橋 | 100 |
| 7行目 | 伊藤 | 100 |
| 8行目 | 渡辺 | 105 |
| 9行目 | 中村 | 110 |
| 10行目 | 小林 | 150 |
| 11行目 | 加藤 | 250 |
歪度を求める
=SKEW(B2:B11)
結果は約 1.67 です。正の値なので、データは右に裾が長い分布(右偏り)になっています。
実際にデータを見ると、大半の人は80〜110万円に集中していて、小林さん(150万円)と加藤さん(250万円)が突出しています。この「一部だけ大きな値がある」状態を、歪度が数値で表しているわけです。
SKEW関数の結果を読み解くポイント
正の歪度・負の歪度・ゼロ付近の意味
歪度の値は、データの分布の形を以下のように教えてくれます。
| 歪度の値 | 分布の形 | 特徴 |
|---|---|---|
| 正(0より大きい) | 右に裾が長い | 低い値に集中し、一部が高い値に飛び出している |
| 負(0より小さい) | 左に裾が長い | 高い値に集中し、一部が低い値に飛び出している |
| ゼロ付近 | ほぼ左右対称 | データが平均値の前後にバランスよく分布している |
もう少し細かく判断するなら、次の目安が使えます。
| 歪度の絶対値 | 偏りの程度 |
|---|---|
| 0.5未満 | ほぼ対称とみなせる |
| 0.5〜1.0 | やや偏りがある |
| 1.0以上 | 強い偏りがある |
先ほどの売上データは約1.67だったので、「強い偏りがある」と判断できます。
AVERAGE・MEDIANとの関係で偏りを確かめる
歪度の値は、平均値と中央値の関係とも連動しています。
- 正の歪度 → 平均値 > 中央値(一部の高い値が平均を引き上げる)
- 負の歪度 → 平均値 < 中央値(一部の低い値が平均を引き下げる)
- 歪度ゼロ付近 → 平均値と中央値がほぼ等しい
先ほどのデータで確認してみましょう。
=AVERAGE(B2:B11)
=MEDIAN(B2:B11)
平均値は 116.5万円、中央値は 100万円 です。平均値のほうが大きいですよね。加藤さんの250万円が平均を引き上げているためです。
歪度が正の値のときは、平均値より中央値のほうがデータの実態に近いことが多いです。このように、SKEW関数は「平均値を信用していいかどうか」の判断材料になります。
SKEW関数の実務活用パターン
売上データの分布傾向を把握する
月ごとの売上データにSKEW関数を適用すると、各月の分布傾向がひと目でわかります。
=SKEW(B2:B31)
歪度が正に大きい月は、一部の大口案件に売上が偏っています。負に大きい月は、一部の低パフォーマンスが全体を引き下げています。
歪度の値に応じて分析のアプローチを変えると効果的です。
| 歪度 | 代表値の選び方 | 分析の着眼点 |
|---|---|---|
| ほぼゼロ | 平均値でOK | 全体の傾向をそのまま分析 |
| 正に偏り | 中央値を使う | 高い値の要因を個別に調査 |
| 負に偏り | 中央値を使う | 低い値の要因を個別に調査 |
TIP
SKEW関数とSTDEV関数を組み合わせると、「データのばらつき」と「偏りの方向」の両方がわかります。ばらつきが大きくても左右対称なら平均値は使えます。ばらつきが小さくても偏っていれば中央値のほうが安全です。
データの正規性を簡易チェックする
統計分析の多くは「データが正規分布に近い」ことを前提にしています。SKEW関数で簡易的に確認できます。
歪度が-0.5〜0.5の範囲に収まっていれば、正規分布に近いとみなせます。この範囲を大きく外れるデータでは、平均値ベースの分析だと結論がずれる可能性があります。
=IF(ABS(SKEW(B2:B31)) < 0.5, "ほぼ正規分布", "偏りあり:中央値を確認")
このような数式をダッシュボードに組み込んでおくと、データの特性を毎回手動で確認する手間が省けます。
SKEW.P関数との使い分け
SKEW関数と同じく歪度を求める関数に、SKEW.P関数があります。
| 項目 | SKEW | SKEW.P |
|---|---|---|
| 計算対象 | 標本(一部のデータ) | 母集団(全データ) |
| 結果 | やや大きくなる | やや小さくなる |
| 使う場面 | データが全体の一部のとき | データが全部そろっているとき |
使い分けの基準はSTDEV関数とSTDEV.P関数の違いと同じです。
- SKEW関数を使う場面: アンケート結果、サンプルデータの分析
- SKEW.P関数を使う場面: クラス全員のテスト結果、全社員の評価データ
迷ったらSKEW関数を使っておけば問題ありません。
SKEW関数でよくあるエラーと対処法
#DIV/0!エラー
SKEW関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| 数値データが2個以下 | 3個以上の数値データを指定する |
| 範囲内に数値が含まれていない | 文字列ばかりの範囲を指定していないか確認する |
| 全データが同じ値(標準偏差が0) | ばらつきのあるデータを用意する |
歪度を計算するには最低3個の数値が必要です。また、すべて同じ値だと標準偏差が0になり、計算できません。
#VALUE!エラー
引数に文字列を直接入力すると発生します。
=SKEW("100", "200", "300") → #VALUE!エラー
=SKEW(100, 200, 300) → 正常に計算される
セル範囲内の文字列は自動で無視されます。直接引数に渡した場合のみエラーになるので注意してください。
TIP
期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。SKEW関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。
まとめ
SKEW関数は、データの歪度(分布の偏り)を返す関数です。
この記事のポイント
- 構文は
=SKEW(値1, [値2], ...)で、セル範囲を指定するだけ - 歪度が正なら右偏り、負なら左偏り、ゼロ付近なら左右対称
- 歪度が大きいと平均値が代表値として不適切。中央値を使うのが安全
- データが「全体の一部」→ SKEW関数、「全部そろっている」→ SKEW.P関数
- 計算には3個以上の数値データが必要
次のステップ:関連する統計関数
SKEW関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。
