スプレッドシートのSKEW関数の使い方|歪度

スポンサーリンク

「売上データの平均値は出したけど、データがどっちかに偏っていないか気になる」。こんな場面はありませんか?

平均値だけでは、データが左右対称に分布しているかわかりません。偏りがあると平均値が代表値としてあてにならないこともあります。

そんなときに使うのがSKEW関数です。この記事では基本の書き方から実務での活用例まで解説します。歪度の読み取り方やSKEW.P関数との違いもあわせて整理しました。

SKEW関数とは?データの歪度を求める関数

SKEW関数(読み方: スキュー関数)は、データの歪度(わいど)を返す関数です。「SKEW」は英語で「歪み・偏り」を意味します。

歪度とは、データの分布が左右対称からどれくらいずれているかを示す統計指標です。平均値と中央値のずれ具合を1つの数値で把握できます。

身近な例でいえば、チームの売上データを考えてみましょう。全員が平均前後に集まっていれば歪度はゼロに近くなります。一方、大半は低めで一部のトップ営業だけ突出しているなら、正の歪度になります。

SKEW関数にできることをまとめると、次のとおりです。

  • データの分布の偏り(歪度)を数値で求める
  • 平均値が代表値として適切かどうかを判断する
  • AVERAGE関数MEDIAN関数と組み合わせて分布の特徴をつかむ

NOTE

SKEW関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。

SKEW関数の書き方(構文と引数)

基本構文

=SKEW(値1, [値2], ...)

カッコの中に、歪度を求めたいデータやセル範囲を指定します。

引数の説明

引数必須/任意説明
値1必須歪度を求めたい最初の値またはセル範囲
値2, …任意追加の値またはセル範囲。最大255個まで指定可能

引数にはセル参照、セル範囲、数値を直接指定できます。

TIP

セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。

歪度の計算にはデータが3個以上必要

SKEW関数は標本歪度を計算します。計算の仕組み上、データが3個以上ないと結果を返せません。2個以下の場合は#DIV/0!エラーになります。

また、すべてのデータが同じ値(標準偏差が0)の場合もエラーになります。ばらつきがないデータでは「偏り」を計算できないためです。

SKEW関数の基本的な使い方

以下の売上データでSKEW関数を使ってみましょう。

B2からB11に10人分の月間売上データ(万円)が入っているとします。

 A列(担当者)B列(売上)
2行目田中80
3行目鈴木85
4行目佐藤90
5行目山田95
6行目高橋100
7行目伊藤100
8行目渡辺105
9行目中村110
10行目小林150
11行目加藤250

歪度を求める

=SKEW(B2:B11)

結果は約 1.67 です。正の値なので、データは右に裾が長い分布(右偏り)になっています。

実際にデータを見ると、大半の人は80〜110万円に集中していて、小林さん(150万円)と加藤さん(250万円)が突出しています。この「一部だけ大きな値がある」状態を、歪度が数値で表しているわけです。

SKEW関数の結果を読み解くポイント

正の歪度・負の歪度・ゼロ付近の意味

歪度の値は、データの分布の形を以下のように教えてくれます。

歪度の値分布の形特徴
正(0より大きい)右に裾が長い低い値に集中し、一部が高い値に飛び出している
負(0より小さい)左に裾が長い高い値に集中し、一部が低い値に飛び出している
ゼロ付近ほぼ左右対称データが平均値の前後にバランスよく分布している

もう少し細かく判断するなら、次の目安が使えます。

歪度の絶対値偏りの程度
0.5未満ほぼ対称とみなせる
0.5〜1.0やや偏りがある
1.0以上強い偏りがある

先ほどの売上データは約1.67だったので、「強い偏りがある」と判断できます。

AVERAGE・MEDIANとの関係で偏りを確かめる

歪度の値は、平均値と中央値の関係とも連動しています。

  • 正の歪度 → 平均値 > 中央値(一部の高い値が平均を引き上げる)
  • 負の歪度 → 平均値 < 中央値(一部の低い値が平均を引き下げる)
  • 歪度ゼロ付近 → 平均値と中央値がほぼ等しい

先ほどのデータで確認してみましょう。

=AVERAGE(B2:B11)
=MEDIAN(B2:B11)

平均値は 116.5万円、中央値は 100万円 です。平均値のほうが大きいですよね。加藤さんの250万円が平均を引き上げているためです。

歪度が正の値のときは、平均値より中央値のほうがデータの実態に近いことが多いです。このように、SKEW関数は「平均値を信用していいかどうか」の判断材料になります。

SKEW関数の実務活用パターン

売上データの分布傾向を把握する

月ごとの売上データにSKEW関数を適用すると、各月の分布傾向がひと目でわかります。

=SKEW(B2:B31)

歪度が正に大きい月は、一部の大口案件に売上が偏っています。負に大きい月は、一部の低パフォーマンスが全体を引き下げています。

歪度の値に応じて分析のアプローチを変えると効果的です。

歪度代表値の選び方分析の着眼点
ほぼゼロ平均値でOK全体の傾向をそのまま分析
正に偏り中央値を使う高い値の要因を個別に調査
負に偏り中央値を使う低い値の要因を個別に調査

TIP

SKEW関数とSTDEV関数を組み合わせると、「データのばらつき」と「偏りの方向」の両方がわかります。ばらつきが大きくても左右対称なら平均値は使えます。ばらつきが小さくても偏っていれば中央値のほうが安全です。

データの正規性を簡易チェックする

統計分析の多くは「データが正規分布に近い」ことを前提にしています。SKEW関数で簡易的に確認できます。

歪度が-0.5〜0.5の範囲に収まっていれば、正規分布に近いとみなせます。この範囲を大きく外れるデータでは、平均値ベースの分析だと結論がずれる可能性があります。

=IF(ABS(SKEW(B2:B31)) < 0.5, "ほぼ正規分布", "偏りあり:中央値を確認")

このような数式をダッシュボードに組み込んでおくと、データの特性を毎回手動で確認する手間が省けます。

SKEW.P関数との使い分け

SKEW関数と同じく歪度を求める関数に、SKEW.P関数があります。

項目SKEWSKEW.P
計算対象標本(一部のデータ)母集団(全データ)
結果やや大きくなるやや小さくなる
使う場面データが全体の一部のときデータが全部そろっているとき

使い分けの基準はSTDEV関数とSTDEV.P関数の違いと同じです。

  • SKEW関数を使う場面: アンケート結果、サンプルデータの分析
  • SKEW.P関数を使う場面: クラス全員のテスト結果、全社員の評価データ

迷ったらSKEW関数を使っておけば問題ありません。

SKEW関数でよくあるエラーと対処法

#DIV/0!エラー

SKEW関数で最もよく見るエラーです。以下の原因が考えられます。

原因対策
数値データが2個以下3個以上の数値データを指定する
範囲内に数値が含まれていない文字列ばかりの範囲を指定していないか確認する
全データが同じ値(標準偏差が0)ばらつきのあるデータを用意する

歪度を計算するには最低3個の数値が必要です。また、すべて同じ値だと標準偏差が0になり、計算できません。

#VALUE!エラー

引数に文字列を直接入力すると発生します。

=SKEW("100", "200", "300")   → #VALUE!エラー
=SKEW(100, 200, 300)          → 正常に計算される

セル範囲内の文字列は自動で無視されます。直接引数に渡した場合のみエラーになるので注意してください。

TIP

期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。SKEW関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。

まとめ

SKEW関数は、データの歪度(分布の偏り)を返す関数です。

この記事のポイント

  • 構文は =SKEW(値1, [値2], ...) で、セル範囲を指定するだけ
  • 歪度が正なら右偏り、負なら左偏り、ゼロ付近なら左右対称
  • 歪度が大きいと平均値が代表値として不適切。中央値を使うのが安全
  • データが「全体の一部」→ SKEW関数、「全部そろっている」→ SKEW.P関数
  • 計算には3個以上の数値データが必要

次のステップ:関連する統計関数

SKEW関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。

タイトルとURLをコピーしました