スプレッドシートのSKEW.P関数の使い方|母集団歪度

スポンサーリンク

「SKEW関数で歪度を求めたけれど、データが全部そろっているなら本当はSKEW.Pを使ったほうがいいのかな?」「.Pが付くかつかないかで結果が変わるけど、どっちが正しいの?」。こんな疑問を持ったことはありませんか?

歪度を求める関数にはSKEWとSKEW.Pの2つがあります。どちらを使うかは「データが全体の一部か、全部そろっているか」で決まります。間違って使うと、分析の結論そのものがブレてしまうこともある重要なポイントです。

この記事ではSKEW.P関数の基本の書き方から実務での活用例まで、図解と数式の両面から丁寧に解説します。SKEW関数との違いや使い分けの基準、よくあるエラーの直し方、FAQまで一気に整理しました。読み終えるころには、評価分析・売上分析・品質管理など実務のあらゆる場面で迷わず使えるようになります。

  1. SKEW.P関数とは?母集団の歪度を求める関数
  2. SKEW.P関数の書き方(構文と引数)
    1. 基本構文
    2. 引数の説明
    3. 歪度の計算にはデータが3個以上必要
  3. SKEW.P関数の基本的な使い方
    1. 母集団の歪度を求める
    2. SKEW関数との結果を比べてみる
    3. AVERAGE・MEDIAN とセットで読む
  4. SKEW関数とSKEW.P関数の違い
    1. 母集団と標本の違い
    2. 計算式の違い
    3. 使い分けの判断基準
  5. SKEW.P関数の実務活用パターン
    1. 全社員の評価スコアの偏りを分析する
    2. 月ごとの売上分布を定点観測する
    3. 正規性の簡易チェックに使う
    4. 品質管理データの歪み検出
    5. アンケート結果の分布から「世論の偏り」を読む
    6. 異常値検出の前段としての歪度モニタリング
  6. SKEW.P関数でよくあるエラーと対処法
    1. #DIV/0!エラー
    2. #VALUE!エラー
    3. #N/Aエラー
    4. 計算結果がおかしいとき
  7. 歪度の値をどう解釈するか(実務向けガイド)
  8. SKEW.P関数のよくある質問(FAQ)
    1. Q1. SKEWとSKEW.Pでは数値がどれくらい違いますか?
    2. Q2. 結果がプラス・マイナスのどちら寄りなら気をつけるべき?
    3. Q3. 平均値ではなく中央値を使ったほうがいいのはどんなとき?
    4. Q4. 全部のデータがあるのに、念のためSKEW関数を使うのはダメ?
    5. Q5. 配列数式やARRAYFORMULAと組み合わせられますか?
    6. Q6. ExcelのSKEW.P関数と結果は完全に同じになりますか?
    7. Q7. データに外れ値がある場合、SKEW.Pの結果は信頼できますか?
    8. Q8. SKEW.Pがマイナス値を返すとき、計算ミスではありませんか?
    9. Q9. データが時系列で増えていきます。歪度はどう監視すれば?
  9. まとめ
    1. この記事のポイント
    2. 次のステップ:関連する統計関数

SKEW.P関数とは?母集団の歪度を求める関数

SKEW.P関数(読み方: スキュー・ピー関数)は、母集団の歪度(わいど)を返す関数です。「P」は「Population(母集団)」の頭文字を表しています。

歪度とは、データの分布が左右対称からどれくらいずれているかを示す統計指標です。次のような目安で読み取ります。

  • 正の値: 右に裾が長い分布(高い側に少数の外れ値)
  • 負の値: 左に裾が長い分布(低い側に少数の外れ値)
  • ゼロ付近: 左右対称(正規分布に近い)

たとえば、部署の全社員30人の評価スコアを分析する場面を考えてみましょう。全員分のデータがそろっているので、これは「母集団」です。このようなケースではSKEW.P関数を使います。

SKEW.P関数を使ってできることをまとめると、次のとおりです。

  • 母集団データの分布の偏り(歪度)を数値で求める
  • 平均値が代表値として適切かどうかを判断する
  • AVERAGE関数MEDIAN関数と組み合わせて分布の特徴をつかむ
  • KURT関数と組み合わせて正規分布の簡易判定を行う

歪度が大きい(プラスでもマイナスでも絶対値が大きい)ほど、平均値が「真ん中らしさ」を失います。歪度を確認することで、平均値だけを見ていてはわからない分布の特徴を捉えられます。

NOTE

SKEW.P関数はGoogleスプレッドシートの全バージョンで使えます。Excelにも同名のSKEW.P関数があり、計算式・動作はまったく同じです。Excelで作成したワークシートをスプレッドシートに移しても結果は変わりません。

SKEW.P関数の書き方(構文と引数)

基本構文

=SKEW.P(値1, [値2], ...)

カッコの中に、歪度を求めたいデータやセル範囲を指定します。SUM関数やAVERAGE関数と同じ感覚で、範囲をひとつ指定するだけで使えます。

引数の説明

引数必須/任意説明
値1必須歪度を求めたい最初の値またはセル範囲
値2, …任意追加の値またはセル範囲。最大255個まで指定可能

引数にはセル参照、セル範囲、数値の直接指定のいずれもできます。離れた範囲を組み合わせたい場合はカンマで区切って渡せばOKです。

=SKEW.P(B2:B11, D2:D11)
=SKEW.P(65, 70, 72, 75, 78, 80, 82, 85, 88, 95)

TIP

セル範囲に含まれる文字列・TRUE/FALSE・空白セルは自動的に無視されます。数値だけが計算の対象になります。文字列を含む列でも、そのまま範囲指定して問題ありません。

歪度の計算にはデータが3個以上必要

SKEW.P関数は母集団の歪度を計算します。計算の仕組み上、データが3個以上ないと結果を返せません。データが2個以下の場合は#DIV/0!エラーになります。

また、すべてのデータが同じ値(標準偏差が0)の場合もエラーになります。ばらつきがないデータでは「偏り」を計算できないためです。たとえば全員のスコアが80点だった場合、歪度は定義できません。

WARNING

SKEW.P関数は0や負の数値も計算対象として扱います。これは数値であれば符号や大きさに関係なく統計処理されるためです。気温データのようにマイナスを含むケースでもそのまま使えますが、誤って「該当なし」の意味で0を入力しているとデータが歪んでしまうので注意してください。

SKEW.P関数の基本的な使い方

以下の評価スコアデータでSKEW.P関数を使ってみましょう。

B2からB11に部署全員10人の評価スコアが入っているとします。全員分のデータなので母集団です。

 A列(社員名)B列(評価スコア)
2行目田中65
3行目鈴木70
4行目佐藤72
5行目山田75
6行目高橋78
7行目伊藤80
8行目渡辺82
9行目中村85
10行目小林88
11行目加藤95

母集団の歪度を求める

=SKEW.P(B2:B11)

結果は約 0.28 です。正の値ですがゼロに近いので、データはほぼ左右対称に分布しているとわかります。

実際にデータを見ると、65〜95の範囲にバランスよく分布していますよね。加藤さん(95点)がやや高めなので、右方向にわずかに引っ張られている形です。それでも「極端な偏り」ではなく、平均値を代表値として使って問題ない水準です。

SKEW関数との結果を比べてみる

同じデータにSKEW関数を使うとどうなるか確認してみましょう。

=SKEW(B2:B11)

SKEW関数の結果は約 0.33 です。SKEW.P関数の 0.28 より少し大きくなっています。この差は計算式の補正の違いによるものです。詳しくは次のセクションで解説します。

AVERAGE・MEDIAN とセットで読む

歪度の数値だけを見ても、実務で活かしにくいことがあります。そんなときは平均値と中央値も並べてチェックするのがおすすめです。

指標
平均値(AVERAGE)79.0
中央値(MEDIAN)79.0
歪度(SKEW.P)約 0.28

平均値と中央値がほぼ一致していて、歪度もゼロ付近。これなら「データは左右対称に分布している」と自信を持って判断できます。逆に平均値と中央値が大きくズレているときは、歪度がプラス・マイナスのどちらに振れているか確認すると分布の偏り方向がわかります。

SKEW関数とSKEW.P関数の違い

SKEW関数とSKEW.P関数はどちらも歪度を求めますが、計算の前提が異なります。

項目SKEWSKEW.P
計算対象標本(一部のデータ)母集団(全データ)
補正あり(不偏推定量)なし
結果やや大きくなる傾向やや小さくなる傾向
データ数が少ないとき差が大きくなる差が大きくなる
データ数が多いとき差はほぼゼロに収束差はほぼゼロに収束

母集団と標本の違い

使い分けを理解するには、「母集団」と「標本」の違いを押さえておくことが大切です。

  • 母集団: 調べたい対象の「全部のデータ」
  • 標本: 母集団から一部を取り出したデータ

たとえば、こんなイメージです。

場面母集団(SKEW.P)標本(SKEW)
テスト分析クラス全員の点数10人だけ抽出した点数
売上分析全店舗の売上5店舗だけ選んだ売上
評価分析全社員の評価データ一部の社員の評価データ
品質管理製造ラインの全製品ロットからの抜き取り検査
アンケート回答者全員全顧客のうち回答した一部

「自分が分析したい対象が、いま手元のデータで全部か?」と一度問いかけるクセをつけると判断ミスを減らせます。

計算式の違い

数式で見ると、違いがはっきりわかります。

SKEW関数の計算式は次のとおりです。

SKEW = (n / ((n-1)(n-2))) × Σ((xi - x̄) / s)³

SKEW.P関数の計算式は次のとおりです。

SKEW.P = (1/n) × Σ((xi - μ) / σ)³

SKEW関数には n / ((n-1)(n-2)) という補正係数がかかります。標本データから母集団の歪度を推定するための補正(不偏推定量と呼ばれます)です。SKEW.P関数にはこの補正がなく、純粋に「与えられたデータそのものの歪度」を計算します。

データ数が多くなるほど補正の影響は小さくなり、SKEWとSKEW.Pの結果はほぼ同じ値に収束します。データ数が少ないとき(数件〜数十件)ほど差が開きます。

使い分けの判断基準

迷ったときは以下を参考にしてください。

判断基準使う関数
データが全部そろっているSKEW.P
データが一部だけSKEW
どちらかわからないSKEW

「全社員のデータ」「クラス全員のテスト結果」「全店舗の月間売上」のように全件データならSKEW.Pを使います。一方、「アンケートの一部回答」「サンプル抽出した品質データ」「市場調査の一部回答者」など、母集団のごく一部を取り出した場合はSKEW関数が適切です。

迷ったらSKEW関数を使っておけば安全です。標本として扱うほうが推定としては保守的で、誤った結論を出すリスクを抑えられます。

TIP

この使い分けはSTDEV.P関数STDEV関数の関係と同じです。「.P」が付く関数は母集団用、付かない関数は標本用と覚えておくと迷いません。同じ「P=Population」の規則性はSTDEVP関数など他の統計関数にも共通します。

SKEW.P関数の実務活用パターン

全社員の評価スコアの偏りを分析する

部署ごとの評価スコアにSKEW.P関数を適用すると、各部署の評価分布の特徴がわかります。全社員のデータなので母集団として扱えます。

=SKEW.P(B2:B31)

歪度の値に応じて、分析のアプローチを変えると効果的です。

歪度評価の傾向対応策
ほぼゼロバランスのよい評価平均値で全体をまとめてOK
正に偏り低評価に集中、一部だけ高評価高評価の要因を分析して共有
負に偏り高評価に集中、一部だけ低評価低評価者のフォロー体制を検討

歪度の符号と大きさを毎期トラッキングしておくと、評価の「ばらまき方」が改善しているかが定量的にわかります。

月ごとの売上分布を定点観測する

全店舗の月間売上データを毎月SKEW.P関数で確認すると、分布の変化を追えます。

=SKEW.P(B2:B21)

先月と今月の歪度を比べて、分布の形が変わっていないかチェックしてみてください。急に歪度が大きくなったら、特定の店舗で異常値(極端な伸びや落ち込み)が発生している可能性があります。前月比較表に「歪度」列を追加して、その変化を売上管理ダッシュボードに組み込むのもおすすめです。

正規性の簡易チェックに使う

KURT関数と組み合わせると、データの分布が正規分布に近いかどうかをすばやく判定できます。

=IF(AND(ABS(SKEW.P(B2:B31)) < 0.5, ABS(KURT(B2:B31)) < 1), "ほぼ正規分布", "偏りあり")

歪度が-0.5〜0.5、尖度が-1〜1の範囲に収まっていれば、正規分布に近いと判断できます。t検定や回帰分析など、正規性を前提とした統計分析を行う前のチェックとして活用してみてください。本格的な検定(シャピロ・ウィルク検定など)の前に「ざっくり大丈夫そうか」を見るスクリーニングに役立ちます。

品質管理データの歪み検出

製造ラインで測定した全製品の寸法・重量データなど、母集団として扱える品質データに使うと、工程の安定性をチェックできます。

=SKEW.P(B2:B1001)

理想的な工程では分布はほぼ正規分布になり、歪度はゼロ付近に収まります。歪度が大きく振れたら、特定の機械・時間帯・原料ロットなどに偏りの原因がある可能性が高いです。STDEV.P関数とセットで監視するのがおすすめです。

アンケート結果の分布から「世論の偏り」を読む

社内アンケートのように「対象者全員から回答を得た」場合は母集団なのでSKEW.P関数の出番です。たとえば1〜10の10段階で満足度を聞いた結果に対して、

=SKEW.P(B2:B201)

として歪度を確認します。歪度がマイナスに大きく振れていれば「高評価寄りに偏っている(=好意的な回答が多い)」、プラスに大きく振れていれば「低評価寄りに偏っている(=不満が多い)」と読めます。単純平均だけだと「だいたい7.0だから大丈夫」と判断しがちですが、歪度を併用すると「平均は高いけど一部に極端な低評価がある」のような分布の暗い面も拾えます。

異常値検出の前段としての歪度モニタリング

ログデータやセンサーデータのように1日あたり数千件以上が記録されるケースでは、毎日の歪度を時系列で並べるだけで「いつもと違う日」が浮き上がります。直近30日間の歪度を折れ線グラフにしておき、平均±2標準偏差を超えた日だけをアラート対象にする、といった運用が現実的です。SKEW.P関数なら全件を母集団として扱える前提でそのまま使えるので、サンプリングを意識せずに済みます。

SKEW.P関数でよくあるエラーと対処法

#DIV/0!エラー

SKEW.P関数で最もよく見るエラーです。以下の原因が考えられます。

原因対策
数値データが2個以下3個以上の数値データを指定する
範囲内に数値が含まれていない文字列ばかりの範囲を指定していないか確認する
全データが同じ値(標準偏差が0)ばらつきのあるデータを用意する

歪度を計算するには最低3個の数値が必要です。また、すべて同じ値だと標準偏差が0になり、ゼロで割る形になってしまうため計算できません。

#VALUE!エラー

引数に文字列を直接入力すると発生します。

=SKEW.P("100", "200", "300")   → #VALUE!エラー
=SKEW.P(100, 200, 300)          → 正常に計算される

セル範囲内の文字列は自動で無視されますが、引数に直接渡した文字列は数値に変換されないためエラーになります。

TIP

期待した結果にならないときは、セル範囲に文字列が混ざっていないか確認してください。SKEW.P関数は文字列を無視するため、データ件数が想定より少なくなっている可能性があります。=COUNT(B2:B31)で数値の個数をチェックすると検算できます。

#N/Aエラー

引数に空セルだけが含まれる範囲を渡すと発生することがあります。データの取得元(VLOOKUP・IMPORTRANGEなど)が一時的にエラーを返している可能性もあるので、ソース側のセル状態をまず確認してください。

計算結果がおかしいとき

「明らかに偏っているはずなのに歪度がゼロ付近になる」「結果が想定外に大きい」といった場合は、以下を疑ってみてください。

  • 数値以外(文字列・空白)が想定より多く混ざっていて、計算対象が少ない
  • 0や負の数値を「該当なし」の意味で入れている
  • データ範囲に集計行(合計・平均など)まで含めてしまっている

範囲指定を見直すだけで結果が一気に正しくなることが多いです。

歪度の値をどう解釈するか(実務向けガイド)

歪度の数値が出てきても「で、結局この数字はどう判断すればいいの?」と迷う方は多いはずです。実務での解釈の目安をまとめておきます。

歪度の絶対値分布の状態実務上の判断
0〜0.2ほぼ対称平均値で語ってOK。正規分布前提の検定も使える
0.2〜0.5わずかに偏り注意して見る程度。平均値+標準偏差で表現
0.5〜1.0やや偏り中央値・分位点も併記する。極端値の確認を
1.0以上強い偏り平均値だけでは語れない。中央値・度数分布を使う

正負どちらに振れるかも要チェックです。正の歪度(右裾が長い)は「外れ値が大きい側にある」、負の歪度(左裾が長い)は「外れ値が小さい側にある」と読めます。たとえば年収・売上・利用時間といったデータは正の歪度になりやすく、テストの満点付近に集中したスコアは負の歪度になりやすい、という具合です。

NOTE

統計学的に厳密な「偏りあり/なし」の判定をしたい場合は、サンプル数を考慮した検定(D’Agostino’s K² 検定など)が必要です。SKEW.P関数の値はあくまで「ざっくり把握」のための指標として使ってください。

SKEW.P関数のよくある質問(FAQ)

Q1. SKEWとSKEW.Pでは数値がどれくらい違いますか?

データ数が少ないほど差は大きくなります。データ10件で1〜2割の差、100件以上では数%以下のごく小さな差に収束していきます。「データが多ければどちらでも実用上は同じ結果」と覚えておけばOKです。

Q2. 結果がプラス・マイナスのどちら寄りなら気をつけるべき?

歪度の絶対値が0.5を超えてくると「やや偏った分布」、1.0を超えると「明らかに偏った分布」と判断するのが一般的な目安です。ただし業界・分析対象によって閾値は変わるので、社内で過去データの歪度を蓄積して自分たちの基準値を決めるのが理想です。

Q3. 平均値ではなく中央値を使ったほうがいいのはどんなとき?

SKEW.P関数の絶対値が大きく(おおむね1以上)、明らかに分布が偏っている場合は、平均値より中央値(MEDIAN関数)のほうが「真ん中らしさ」をうまく表現します。売上・年収・滞在時間など右に裾が長くなりやすいデータでは特に注意してください。

Q4. 全部のデータがあるのに、念のためSKEW関数を使うのはダメ?

ダメではありません。実務的にはSKEW関数で代用しても大きな結論の違いは出にくいです。ただし統計レポートや論文など「母集団に対する記述統計」として明示する場合は、SKEW.P関数を使うのが正しい選択です。

Q5. 配列数式やARRAYFORMULAと組み合わせられますか?

可能です。たとえばグループごとに歪度を一気に求めたい場合は、QUERY関数やBYROWMAP関数と組み合わせる方法があります。ただし、SKEW.P関数自体は単一の集計値を返す関数なので、ARRAYFORMULAだけでは1行ごとの展開はできません。集計の単位ごとにセル位置を分けて配置するのが基本です。

Q6. ExcelのSKEW.P関数と結果は完全に同じになりますか?

はい、まったく同じ結果になります。SKEW.PはExcel 2013 以降に追加された関数で、計算式はGoogleスプレッドシートと共通です。CSVなどでデータを行き来させても、歪度の値はズレません。

Q7. データに外れ値がある場合、SKEW.Pの結果は信頼できますか?

歪度は外れ値の影響を強く受ける指標です。3乗の項が含まれるため、極端な値が1つあるだけで結果が大きく変動します。外れ値が混ざっているかどうかをまず確認し、必要に応じてTRIMMEAN関数のように上下を切り捨てた集計と組み合わせて判断するのが安全です。「歪度の値が異常に大きい」と感じたら、まず最大値・最小値を見直してみてください。

Q8. SKEW.Pがマイナス値を返すとき、計算ミスではありませんか?

マイナス値は正しい計算結果です。歪度がマイナスということは「分布が左に裾を引いている」という意味で、たとえば高評価に集中して一部だけ極端に低い人がいるようなデータでよく見られます。符号は分布の形を表すサインなので、絶対値の大小と合わせて判断してください。

Q9. データが時系列で増えていきます。歪度はどう監視すれば?

毎日・毎週・毎月といった単位で歪度をスナップショット保存し、折れ線グラフでトラッキングするのがおすすめです。歪度が急変したタイミングが「分布が変わった日」なので、そこから原因を追っていくと異常検知に活用できます。ダッシュボード化する場合は、AVERAGE・STDEV.P・SKEW.P・KURTを横並びで表示する形式が読みやすいです。

まとめ

SKEW.P関数は、母集団の歪度(分布の偏り)を返す関数です。

この記事のポイント

  • 構文は =SKEW.P(値1, [値2], ...) で、セル範囲を指定するだけ
  • 「全部のデータ」が対象ならSKEW.P関数、「一部のデータ」ならSKEW関数
  • SKEW関数より結果がやや小さくなる(補正がないため)
  • 歪度が正なら右偏り、負なら左偏り、ゼロ付近なら左右対称
  • 迷ったらSKEW関数を使っておけば安全
  • 計算には3個以上の数値データが必要
  • AVERAGE・MEDIAN・KURTと組み合わせると分布の特徴がより立体的に見える

次のステップ:関連する統計関数

SKEW.P関数の使い方がわかったら、以下の関数もあわせて覚えてみてください。データ分析の幅が大きく広がります。

平均値だけでは見えない「分布のクセ」を、歪度というワンレベル上の指標で捉えてみてください。意思決定の質がぐっと上がります。

タイトルとURLをコピーしました