ExcelのHYPGEOMDIST関数の使い方|超幾何分布(旧: HYPGEOM.DIST)

スポンサーリンク

ExcelのHYPGEOMDIST関数の使い方|超幾何分布(旧: HYPGEOM.DIST)

古いExcelファイルを開いたら =HYPGEOMDIST(...) という見慣れない関数が使われていて、戸惑ったことはありませんか。新しいExcelには似た名前の HYPGEOM.DIST 関数もあって、どちらを使えばいいのか迷いますよね。

そんなときに知っておきたいのが、ExcelのHYPGEOMDIST関数(旧版・互換性関数)です。Excel 2010以降は新しいHYPGEOM.DIST関数に置き換わりました。ただ、旧バージョンとの互換性のためにHYPGEOMDIST関数も今のExcelに残されているんですよ。

この関数の役割は「戻さずに引くときの確率を計算する」ことです。たとえば「100個の部品から10個を抜き取って検査して、不良品が0個である確率」を、たった1つの数式で求められます。

本記事では、HYPGEOMDIST関数の構文と引数の意味、新関数HYPGEOM.DISTとの違いを解説します。さらに、抜き取り検査やくじ引きの確率計算など実務で使えるパターン、よくあるエラー対処法も紹介しますので、ぜひ参考にしてくださいね。

ExcelのHYPGEOMDIST関数とは?HYPGEOM.DISTとの関係を整理

ExcelのHYPGEOMDIST関数(読み方: ハイパージオム・ディスト関数)は、超幾何分布にもとづいて確率を返す旧関数です。Excel 2007以前から使えます。

Excel 2010以降では、後継のHYPGEOM.DIST関数(ピリオドあり)が追加されました。両者の違いは引数の数です。HYPGEOMDISTは4引数で確率質量だけを返すのに対し、HYPGEOM.DISTは5引数で累積確率も計算できます。

項目HYPGEOMDIST(旧)HYPGEOM.DIST(新)
追加バージョンExcel 2007以前Excel 2010で追加
引数の数4個5個
累積確率計算できない計算できる(5番目引数=TRUE)
確率質量計算できる計算できる(5番目引数=FALSE)
互換性全バージョンで動作Excel 2010以降のみ
Microsoftの推奨互換性関数(移行推奨)推奨

既存シートに書かれたHYPGEOMDISTは、そのまま動作します。ただし、Microsoftは「将来のバージョンで使用不可になる可能性がある」と公式に警告しています。新規ファイルでは、HYPGEOM.DISTを使うことをおすすめしますよ。

NOTE

超幾何分布とは、有限母集団からの非復元抽出(戻さない抽出)にもとづく確率分布です。引くたびに残りの個数が減るため、毎回の確率が変わるのが特徴ですね。

HYPGEOMDIST関数の書式(4つの引数)

ExcelのHYPGEOMDIST関数の基本構文は次のとおりです。

=HYPGEOMDIST(標本成功数, 標本サイズ, 母集団成功数, 母集団サイズ)

カッコの中に4つの引数を指定します。

引数説明有効範囲
標本成功数(sample_s)標本内の成功数(ちょうど何個成功するか)0以上
標本サイズ(number_sample)標本のサイズ(何個抽出するか)0より大きく母集団サイズ以下
母集団成功数(population_s)母集団内の成功数(全体の成功要素数)0より大きく母集団サイズ以下
母集団サイズ(number_pop)母集団のサイズ(全体の要素数)0より大きい

引数の流れは「標本→母集団」の順番です。まず「標本のなかで何個成功したか」「標本は何個か」を指定します。次に「母集団の成功数は何個か」「母集団は何個か」を指定する形ですね。

戻り値は「標本サイズ中、ちょうど標本成功数だけ成功する確率(確率質量)」です。0以上1以下の値が返ります。

TIP

引数に小数を指定すると、Excelは自動的に小数部分を切り捨てて処理します。意図しない結果を避けるため、最初から整数で指定するのが安心ですよ。

HYPGEOMDIST関数の基本的な使い方

実際にHYPGEOMDIST関数を使ってみましょう。「20枚のくじ(うち当たり3枚)から5枚引いて、当たりがちょうど1枚出る確率」を計算します。

=HYPGEOMDIST(1, 5, 3, 20)

このとき各引数は次のとおりです。

  • 標本成功数=1(ちょうど1枚当てたい)
  • 標本サイズ=5(5枚引く)
  • 母集団成功数=3(全体の当たりは3枚)
  • 母集団サイズ=20(くじは全部で20枚)

結果は約0.4605、つまり約46.05%の確率で「ちょうど1枚」当たると分かります。

セルに直接数値を書き込む代わりに、セル参照を使うこともできます。たとえばA2に1、B2に5、C2に3、D2に20を入れて、E2に次の数式を入力します。

=HYPGEOMDIST(A2, B2, C2, D2)

これなら、引数を変えるたびに結果が更新されるので、いろいろなパターンを試しやすいですよ。

超幾何分布と二項分布の違い(非復元 vs 復元)

HYPGEOMDIST関数を使うときに意識したいのが、超幾何分布と二項分布の違いです。どちらも「成功か失敗か」の確率を扱いますが、抽出方法が違います。

項目超幾何分布(HYPGEOMDIST)二項分布(BINOMDIST
抽出方法非復元抽出(戻さない)復元抽出(戻す)
各試行の確率試行ごとに変動一定
母集団サイズ有限無限または大きい
用途抜き取り検査・くじ引き・カードコイン投げ・サイコロ・大量生産

非復元抽出は「引いたら戻さない」方法です。くじを引いた後そのくじを袋に戻さないので、残りのくじが減って毎回の確率が変わります。

復元抽出は「引いたら戻す」方法です。コインを投げるたびに同じ確率で表が出るのと同じで、各試行の確率は一定ですね。

使い分けの目安はこちらです。

  • 母集団が小さい(数十〜数百)→ 超幾何分布(HYPGEOMDIST)
  • 母集団が大きい(標本サイズの10倍以上)→ 二項分布で近似可能
  • 「戻す/戻さない」が明確な場合は厳密にどちらかを選ぶ

抜き取り検査のように「ロットから戻さずに引く」場面はHYPGEOMDIST、コイン投げのように「毎回独立に試行する」場面はBINOMDIST、と覚えておくと迷いませんよ。

HYPGEOMDIST関数の実務での活用例(抜き取り検査)

HYPGEOMDIST関数の出番が多い場面のひとつが、品質管理の抜き取り検査です。ロット全体を検査するのは大変なので、一部を抜き取って合格・不合格を判定するときの確率計算に使います。

たとえば「100個の部品ロットから10個を抜き取り検査して、不良品が0個である確率」を求めてみます。前提として、ロットには5個の不良品が含まれていると仮定します。

=HYPGEOMDIST(0, 10, 5, 100)

結果は約0.5837、つまり約58.37%の確率で「10個中、不良品が0個」となります。

不良品が「ちょうど1個出る確率」も同じ要領で計算できます。

=HYPGEOMDIST(1, 10, 5, 100)

こちらは約34.39%です。

TIP

「不良品が1個以下である確率」のような累積確率を出したいときは、HYPGEOMDISTを足し合わせます。=HYPGEOMDIST(0,10,5,100)+HYPGEOMDIST(1,10,5,100) で約92.76%が求まりますよ。新関数HYPGEOM.DISTなら、5番目の引数にTRUEを入れるだけで一発で出せます。累積確率を頻繁に使うなら新関数への移行がおすすめです。

抜き取り検査の合格判定(許容不良品数以下である確率)を出せば、ロットの合格率が見えてきます。検査計画の妥当性チェックや、サンプリング基準の見直しに活用できますよ。

HYPGEOMDISTでよくあるエラーと対処法

HYPGEOMDIST関数を使っていて遭遇しやすいエラーと、その原因・対処法をまとめました。

エラー表示主な原因対処法
#NUM!引数が有効範囲外(負の数、上限超過、大小関係が不正)引数の範囲を確認。標本成功数 ≤ MIN(標本サイズ, 母集団成功数) を満たすこと
#VALUE!引数が数値でない(文字列が入っている)セル参照先の値を確認、数値に修正
#NAME?関数名のスペルミスHYPGEOMDIST(ピリオドなし)か HYPGEOM.DIST(ピリオドあり)かを再確認

特に多いのが#NUM!エラーです。「標本成功数が標本サイズより大きい」「母集団成功数が母集団サイズより大きい」など、論理的にあり得ない値を指定すると発生します。

たとえば =HYPGEOMDIST(5, 3, 2, 10) は#NUM!になります。標本サイズ3個から成功5個を取り出すことはできないからですね。

引数の有効範囲を整理するとこうなります。

  • 標本成功数 ≥ 0 かつ 標本成功数 ≤ MIN(標本サイズ, 母集団成功数)
  • 標本サイズ > 0 かつ 標本サイズ ≤ 母集団サイズ
  • 母集団成功数 > 0 かつ 母集団成功数 ≤ 母集団サイズ
  • 母集団サイズ > 0

この範囲を外れると#NUM!になるので、データ入力時にチェックを入れておくと安心ですよ。

HYPGEOMDISTとHYPGEOM.DISTの使い分け

旧関数HYPGEOMDISTと新関数HYPGEOM.DISTの使い分けの目安をまとめました。

HYPGEOMDIST(旧)を使う場面

  • 既存の古いExcelファイルを保守する場合(数式を変更したくない)
  • Excel 2007以前との互換性が必要な場合(xls形式で配布など)
  • 確率質量だけ計算できればよい場面

HYPGEOM.DIST(新)を使う場面

  • 新規にExcelファイルを作成する場合
  • 累積確率(k個以下成功する確率)を計算したい場合
  • 将来も長く使い続けるシートを設計する場合

迷ったときは新関数のHYPGEOM.DISTを選んでおけば間違いありません。Microsoftも公式に新関数を推奨していますし、累積確率まで一発で計算できるので応用範囲も広いんですよ。

NOTE

旧関数から新関数への移行は、HYPGEOMDIST(a, b, c, d)HYPGEOM.DIST(a, b, c, d, FALSE) に置き換えるだけで完了します。第5引数のFALSEは「確率質量を返す」という指定で、旧関数と同じ結果が得られます。

確率分布関数のシリーズ記事として、HYPGEOM.DIST関数の使い方BINOM.DIST関数GAMMADIST関数も合わせて読むと、Excelの統計関数全体の見通しがよくなりますよ。

まとめ:HYPGEOMDIST関数で非復元抽出の確率を計算しよう

ExcelのHYPGEOMDIST関数は、超幾何分布(非復元抽出)にもとづく確率を計算する旧関数です。本記事のポイントを振り返ります。

  • HYPGEOMDISTは4引数で確率質量だけを計算する旧関数(互換性関数)
  • 後継のHYPGEOM.DIST(5引数)は累積確率も計算できる
  • 超幾何分布は「戻さずに引く」場面の確率分布で、二項分布(戻す)と区別する
  • 抜き取り検査・くじ引き・カード抽選などの確率計算に活用できる
  • #NUM!エラーは引数の有効範囲(標本成功数 ≤ MIN(標本サイズ, 母集団成功数) など)を確認する
  • 新規ファイルでは新関数HYPGEOM.DISTを使うのがおすすめ

「戻さずに引く」場面の確率を、感覚ではなく数式で答えられるようになるとExcelの活用範囲がぐっと広がります。まずは身近なくじ引きや抜き取り検査で、HYPGEOMDIST関数の動きを試してみてくださいね。

タイトルとURLをコピーしました