スプレッドシートのSKEW.P関数の使い方|母集団歪度

スポンサーリンク

「SKEW関数で歪度を求めたけど、データが全部そろっているならSKEW.Pを使うべき?」。こんな疑問を持ったことはありませんか?

歪度を求める関数にはSKEWとSKEW.Pの2つがあります。どちらを使うかは「データが全体の一部か、全部そろっているか」で決まります。

この記事ではSKEW.P関数の基本の書き方から実務での活用例まで解説します。SKEW関数との違いや使い分けの基準もあわせて整理しました。

SKEW.P関数とは?母集団の歪度を求める関数

SKEW.P関数(読み方: スキュー・ピー関数)は、母集団の歪度(わいど)を返す関数です。「P」は「Population(母集団)」の頭文字です。

歪度とは、データの分布が左右対称からどれくらいずれているかを示す統計指標です。正の値なら右に裾が長い分布、負の値なら左に裾が長い分布を意味します。

たとえば、部署の全社員30人の評価スコアを分析する場面を考えてみましょう。全員分のデータがそろっているので、これは母集団です。このようなケースではSKEW.P関数を使います。

SKEW.P関数にできることをまとめると、次のとおりです。

  • 母集団データの分布の偏り(歪度)を数値で求める
  • 平均値が代表値として適切かどうかを判断する
  • AVERAGE関数MEDIAN関数と組み合わせて分布の特徴をつかむ

NOTE

SKEW.P関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。

SKEW.P関数の書き方(構文と引数)

基本構文

=SKEW.P(値1, [値2], ...)

カッコの中に、歪度を求めたいデータやセル範囲を指定します。

引数の説明

引数必須/任意説明
値1必須歪度を求めたい最初の値またはセル範囲
値2, …任意追加の値またはセル範囲。最大255個まで指定可能

引数にはセル参照、セル範囲、数値を直接指定できます。

TIP

セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。

歪度の計算にはデータが3個以上必要

SKEW.P関数は母集団の歪度を計算します。計算の仕組み上、データが3個以上ないと結果を返せません。2個以下の場合は#DIV/0!エラーになります。

また、すべてのデータが同じ値(標準偏差が0)の場合もエラーになります。ばらつきがないデータでは「偏り」を計算できないためです。

SKEW.P関数の基本的な使い方

以下の評価スコアデータでSKEW.P関数を使ってみましょう。

B2からB11に部署全員10人の評価スコアが入っているとします。全員分のデータなので母集団です。

 A列(社員名)B列(評価スコア)
2行目田中65
3行目鈴木70
4行目佐藤72
5行目山田75
6行目高橋78
7行目伊藤80
8行目渡辺82
9行目中村85
10行目小林88
11行目加藤95

母集団の歪度を求める

=SKEW.P(B2:B11)

結果は約 0.28 です。正の値ですがゼロに近いので、データはほぼ左右対称に分布しているとわかります。

実際にデータを見ると、65〜95の範囲にバランスよく分布していますよね。加藤さん(95点)がやや高めですが、極端な偏りではありません。

SKEW関数との結果を比べてみる

同じデータにSKEW関数を使うとどうなるか確認してみましょう。

=SKEW(B2:B11)

SKEW関数の結果は約 0.33 です。SKEW.P関数の 0.28 より少し大きくなります。この差は計算式の補正の違いによるものです。詳しくは次のセクションで解説します。

SKEW関数とSKEW.P関数の違い

SKEW関数とSKEW.P関数はどちらも歪度を求めますが、計算の前提が異なります。

項目SKEWSKEW.P
計算対象標本(一部のデータ)母集団(全データ)
補正あり(不偏推定量)なし
結果やや大きくなる傾向やや小さくなる傾向
データ数が少ないとき差が大きくなる差が大きくなる

母集団と標本の違い

使い分けを理解するには、「母集団」と「標本」の違いを押さえておくことが大切です。

  • 母集団: 調べたい対象の「全部のデータ」
  • 標本: 母集団から一部を取り出したデータ

たとえば、こんなイメージです。

場面母集団(SKEW.P)標本(SKEW)
テスト分析クラス全員の点数10人だけ抽出した点数
売上分析全店舗の売上5店舗だけ選んだ売上
評価分析全社員の評価データ一部の社員の評価データ

計算式の違い

数式で見ると、違いがはっきりわかります。

SKEW関数の計算式は次のとおりです。

SKEW = (n / ((n-1)(n-2))) × Σ((xi - x̄) / s)³

SKEW.P関数の計算式は次のとおりです。

SKEW.P = (1/n) × Σ((xi - μ) / σ)³

SKEW関数には n / ((n-1)(n-2)) という補正係数がかかります。標本データから母集団の歪度を推定するための補正です。SKEW.P関数にはこの補正がありません。

データ数が多ければ補正の影響は小さくなり、結果はほぼ同じになります。データ数が少ないときほど差が開きます。

使い分けの判断基準

迷ったときは以下を参考にしてください。

判断基準使う関数
データが全部そろっているSKEW.P
データが一部だけSKEW
どちらかわからないSKEW

「全社員のデータ」「クラス全員のテスト結果」「全店舗の月間売上」のように全件データならSKEW.Pを使います。「アンケートの回答(全員ではない)」「サンプル抽出したデータ」ならSKEW関数です。

迷ったらSKEW関数を使っておけば安全です。標本として扱うほうが推定の精度は保たれます。

TIP

この使い分けはSTDEV.P関数STDEV関数の関係と同じです。「.P」が付く関数は母集団用、付かない関数は標本用と覚えておくと迷いません。

SKEW.P関数の実務活用パターン

全社員の評価スコアの偏りを分析する

部署ごとの評価スコアにSKEW.P関数を適用すると、各部署の評価分布の特徴がわかります。全社員のデータなので母集団として扱えます。

=SKEW.P(B2:B31)

歪度の値に応じて、分析のアプローチを変えると効果的です。

歪度評価の傾向対応策
ほぼゼロバランスのよい評価平均値で全体をまとめてOK
正に偏り低評価に集中、一部だけ高評価高評価の要因を分析して共有
負に偏り高評価に集中、一部だけ低評価低評価者のフォロー体制を検討

月ごとの売上分布を定点観測する

全店舗の月間売上データを毎月SKEW.P関数で確認すると、分布の変化を追えます。

=SKEW.P(B2:B21)

先月と今月の歪度を比べて、分布の形が変わっていないかチェックしてみてください。急に歪度が大きくなったら、特定の店舗で異常値が発生している可能性があります。

正規性の簡易チェックに使う

KURT関数と組み合わせると、データの分布が正規分布に近いかどうかをすばやく判定できます。

=IF(AND(ABS(SKEW.P(B2:B31)) < 0.5, ABS(KURT(B2:B31)) < 1), "ほぼ正規分布", "偏りあり")

歪度が-0.5〜0.5、尖度が-1〜1の範囲に収まっていれば、正規分布に近いと判断できます。統計分析の前提条件チェックとして活用してみてください。

SKEW.P関数でよくあるエラーと対処法

#DIV/0!エラー

SKEW.P関数で最もよく見るエラーです。以下の原因が考えられます。

原因対策
数値データが2個以下3個以上の数値データを指定する
範囲内に数値が含まれていない文字列ばかりの範囲を指定していないか確認する
全データが同じ値(標準偏差が0)ばらつきのあるデータを用意する

歪度を計算するには最低3個の数値が必要です。また、すべて同じ値だと標準偏差が0になり、計算できません。

#VALUE!エラー

引数に文字列を直接入力すると発生します。

=SKEW.P("100", "200", "300")   → #VALUE!エラー
=SKEW.P(100, 200, 300)          → 正常に計算される

セル範囲内の文字列は自動で無視されます。直接引数に渡した場合のみエラーになるので注意してください。

TIP

期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。SKEW.P関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。

まとめ

SKEW.P関数は、母集団の歪度(分布の偏り)を返す関数です。

この記事のポイント

  • 構文は =SKEW.P(値1, [値2], ...) で、セル範囲を指定するだけ
  • 「全部のデータ」が対象ならSKEW.P関数、「一部のデータ」ならSKEW関数
  • SKEW関数より結果がやや小さくなる(補正がないため)
  • 歪度が正なら右偏り、負なら左偏り、ゼロ付近なら左右対称
  • 迷ったらSKEW関数を使っておけば安全
  • 計算には3個以上の数値データが必要

次のステップ:関連する統計関数

SKEW.P関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。

タイトルとURLをコピーしました