「SKEW関数で歪度を求めたけど、データが全部そろっているならSKEW.Pを使うべき?」。こんな疑問を持ったことはありませんか?
歪度を求める関数にはSKEWとSKEW.Pの2つがあります。どちらを使うかは「データが全体の一部か、全部そろっているか」で決まります。
この記事ではSKEW.P関数の基本の書き方から実務での活用例まで解説します。SKEW関数との違いや使い分けの基準もあわせて整理しました。
SKEW.P関数とは?母集団の歪度を求める関数
SKEW.P関数(読み方: スキュー・ピー関数)は、母集団の歪度(わいど)を返す関数です。「P」は「Population(母集団)」の頭文字です。
歪度とは、データの分布が左右対称からどれくらいずれているかを示す統計指標です。正の値なら右に裾が長い分布、負の値なら左に裾が長い分布を意味します。
たとえば、部署の全社員30人の評価スコアを分析する場面を考えてみましょう。全員分のデータがそろっているので、これは母集団です。このようなケースではSKEW.P関数を使います。
SKEW.P関数にできることをまとめると、次のとおりです。
NOTE
SKEW.P関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名の関数があり、動作は同じです。
SKEW.P関数の書き方(構文と引数)
基本構文
=SKEW.P(値1, [値2], ...)
カッコの中に、歪度を求めたいデータやセル範囲を指定します。
引数の説明
| 引数 | 必須/任意 | 説明 |
|---|---|---|
| 値1 | 必須 | 歪度を求めたい最初の値またはセル範囲 |
| 値2, … | 任意 | 追加の値またはセル範囲。最大255個まで指定可能 |
引数にはセル参照、セル範囲、数値を直接指定できます。
TIP
セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。
歪度の計算にはデータが3個以上必要
SKEW.P関数は母集団の歪度を計算します。計算の仕組み上、データが3個以上ないと結果を返せません。2個以下の場合は#DIV/0!エラーになります。
また、すべてのデータが同じ値(標準偏差が0)の場合もエラーになります。ばらつきがないデータでは「偏り」を計算できないためです。
SKEW.P関数の基本的な使い方
以下の評価スコアデータでSKEW.P関数を使ってみましょう。
B2からB11に部署全員10人の評価スコアが入っているとします。全員分のデータなので母集団です。
| A列(社員名) | B列(評価スコア) | |
|---|---|---|
| 2行目 | 田中 | 65 |
| 3行目 | 鈴木 | 70 |
| 4行目 | 佐藤 | 72 |
| 5行目 | 山田 | 75 |
| 6行目 | 高橋 | 78 |
| 7行目 | 伊藤 | 80 |
| 8行目 | 渡辺 | 82 |
| 9行目 | 中村 | 85 |
| 10行目 | 小林 | 88 |
| 11行目 | 加藤 | 95 |
母集団の歪度を求める
=SKEW.P(B2:B11)
結果は約 0.28 です。正の値ですがゼロに近いので、データはほぼ左右対称に分布しているとわかります。
実際にデータを見ると、65〜95の範囲にバランスよく分布していますよね。加藤さん(95点)がやや高めですが、極端な偏りではありません。
SKEW関数との結果を比べてみる
同じデータにSKEW関数を使うとどうなるか確認してみましょう。
=SKEW(B2:B11)
SKEW関数の結果は約 0.33 です。SKEW.P関数の 0.28 より少し大きくなります。この差は計算式の補正の違いによるものです。詳しくは次のセクションで解説します。
SKEW関数とSKEW.P関数の違い
SKEW関数とSKEW.P関数はどちらも歪度を求めますが、計算の前提が異なります。
| 項目 | SKEW | SKEW.P |
|---|---|---|
| 計算対象 | 標本(一部のデータ) | 母集団(全データ) |
| 補正 | あり(不偏推定量) | なし |
| 結果 | やや大きくなる傾向 | やや小さくなる傾向 |
| データ数が少ないとき | 差が大きくなる | 差が大きくなる |
母集団と標本の違い
使い分けを理解するには、「母集団」と「標本」の違いを押さえておくことが大切です。
- 母集団: 調べたい対象の「全部のデータ」
- 標本: 母集団から一部を取り出したデータ
たとえば、こんなイメージです。
| 場面 | 母集団(SKEW.P) | 標本(SKEW) |
|---|---|---|
| テスト分析 | クラス全員の点数 | 10人だけ抽出した点数 |
| 売上分析 | 全店舗の売上 | 5店舗だけ選んだ売上 |
| 評価分析 | 全社員の評価データ | 一部の社員の評価データ |
計算式の違い
数式で見ると、違いがはっきりわかります。
SKEW関数の計算式は次のとおりです。
SKEW = (n / ((n-1)(n-2))) × Σ((xi - x̄) / s)³
SKEW.P関数の計算式は次のとおりです。
SKEW.P = (1/n) × Σ((xi - μ) / σ)³
SKEW関数には n / ((n-1)(n-2)) という補正係数がかかります。標本データから母集団の歪度を推定するための補正です。SKEW.P関数にはこの補正がありません。
データ数が多ければ補正の影響は小さくなり、結果はほぼ同じになります。データ数が少ないときほど差が開きます。
使い分けの判断基準
迷ったときは以下を参考にしてください。
「全社員のデータ」「クラス全員のテスト結果」「全店舗の月間売上」のように全件データならSKEW.Pを使います。「アンケートの回答(全員ではない)」「サンプル抽出したデータ」ならSKEW関数です。
迷ったらSKEW関数を使っておけば安全です。標本として扱うほうが推定の精度は保たれます。
TIP
この使い分けはSTDEV.P関数とSTDEV関数の関係と同じです。「.P」が付く関数は母集団用、付かない関数は標本用と覚えておくと迷いません。
SKEW.P関数の実務活用パターン
全社員の評価スコアの偏りを分析する
部署ごとの評価スコアにSKEW.P関数を適用すると、各部署の評価分布の特徴がわかります。全社員のデータなので母集団として扱えます。
=SKEW.P(B2:B31)
歪度の値に応じて、分析のアプローチを変えると効果的です。
| 歪度 | 評価の傾向 | 対応策 |
|---|---|---|
| ほぼゼロ | バランスのよい評価 | 平均値で全体をまとめてOK |
| 正に偏り | 低評価に集中、一部だけ高評価 | 高評価の要因を分析して共有 |
| 負に偏り | 高評価に集中、一部だけ低評価 | 低評価者のフォロー体制を検討 |
月ごとの売上分布を定点観測する
全店舗の月間売上データを毎月SKEW.P関数で確認すると、分布の変化を追えます。
=SKEW.P(B2:B21)
先月と今月の歪度を比べて、分布の形が変わっていないかチェックしてみてください。急に歪度が大きくなったら、特定の店舗で異常値が発生している可能性があります。
正規性の簡易チェックに使う
KURT関数と組み合わせると、データの分布が正規分布に近いかどうかをすばやく判定できます。
=IF(AND(ABS(SKEW.P(B2:B31)) < 0.5, ABS(KURT(B2:B31)) < 1), "ほぼ正規分布", "偏りあり")
歪度が-0.5〜0.5、尖度が-1〜1の範囲に収まっていれば、正規分布に近いと判断できます。統計分析の前提条件チェックとして活用してみてください。
SKEW.P関数でよくあるエラーと対処法
#DIV/0!エラー
SKEW.P関数で最もよく見るエラーです。以下の原因が考えられます。
| 原因 | 対策 |
|---|---|
| 数値データが2個以下 | 3個以上の数値データを指定する |
| 範囲内に数値が含まれていない | 文字列ばかりの範囲を指定していないか確認する |
| 全データが同じ値(標準偏差が0) | ばらつきのあるデータを用意する |
歪度を計算するには最低3個の数値が必要です。また、すべて同じ値だと標準偏差が0になり、計算できません。
#VALUE!エラー
引数に文字列を直接入力すると発生します。
=SKEW.P("100", "200", "300") → #VALUE!エラー
=SKEW.P(100, 200, 300) → 正常に計算される
セル範囲内の文字列は自動で無視されます。直接引数に渡した場合のみエラーになるので注意してください。
TIP
期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。SKEW.P関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。
まとめ
SKEW.P関数は、母集団の歪度(分布の偏り)を返す関数です。
この記事のポイント
- 構文は
=SKEW.P(値1, [値2], ...)で、セル範囲を指定するだけ - 「全部のデータ」が対象ならSKEW.P関数、「一部のデータ」ならSKEW関数
- SKEW関数より結果がやや小さくなる(補正がないため)
- 歪度が正なら右偏り、負なら左偏り、ゼロ付近なら左右対称
- 迷ったらSKEW関数を使っておけば安全
- 計算には3個以上の数値データが必要
次のステップ:関連する統計関数
SKEW.P関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が広がりますよ。
