ExcelのHYPGEOMDIST関数の使い方|超幾何分布(旧: HYPGEOM.DIST)
古いExcelファイルを開いたら =HYPGEOMDIST(...) という見慣れない関数が使われていて、戸惑ったことはありませんか。新しいExcelには似た名前の HYPGEOM.DIST 関数もあって、どちらを使えばいいのか迷いますよね。
そんなときに知っておきたいのが、ExcelのHYPGEOMDIST関数(旧版・互換性関数)です。Excel 2010以降は新しいHYPGEOM.DIST関数に置き換わりました。ただ、旧バージョンとの互換性のためにHYPGEOMDIST関数も今のExcelに残されているんですよ。
この関数の役割は「戻さずに引くときの確率を計算する」ことです。たとえば「100個の部品から10個を抜き取って検査して、不良品が0個である確率」を、たった1つの数式で求められます。
本記事では、HYPGEOMDIST関数の構文と引数の意味、新関数HYPGEOM.DISTとの違いを解説します。さらに、抜き取り検査やくじ引きの確率計算など実務で使えるパターン、よくあるエラー対処法も紹介しますので、ぜひ参考にしてくださいね。
ExcelのHYPGEOMDIST関数とは?HYPGEOM.DISTとの関係を整理
ExcelのHYPGEOMDIST関数(読み方: ハイパージオム・ディスト関数)は、超幾何分布にもとづいて確率を返す旧関数です。Excel 2007以前から使えます。
Excel 2010以降では、後継のHYPGEOM.DIST関数(ピリオドあり)が追加されました。両者の違いは引数の数です。HYPGEOMDISTは4引数で確率質量だけを返すのに対し、HYPGEOM.DISTは5引数で累積確率も計算できます。
| 項目 | HYPGEOMDIST(旧) | HYPGEOM.DIST(新) |
|---|---|---|
| 追加バージョン | Excel 2007以前 | Excel 2010で追加 |
| 引数の数 | 4個 | 5個 |
| 累積確率 | 計算できない | 計算できる(5番目引数=TRUE) |
| 確率質量 | 計算できる | 計算できる(5番目引数=FALSE) |
| 互換性 | 全バージョンで動作 | Excel 2010以降のみ |
| Microsoftの推奨 | 互換性関数(移行推奨) | 推奨 |
既存シートに書かれたHYPGEOMDISTは、そのまま動作します。ただし、Microsoftは「将来のバージョンで使用不可になる可能性がある」と公式に警告しています。新規ファイルでは、HYPGEOM.DISTを使うことをおすすめしますよ。
NOTE
超幾何分布とは、有限母集団からの非復元抽出(戻さない抽出)にもとづく確率分布です。引くたびに残りの個数が減るため、毎回の確率が変わるのが特徴ですね。
HYPGEOMDIST関数の書式(4つの引数)
ExcelのHYPGEOMDIST関数の基本構文は次のとおりです。
=HYPGEOMDIST(標本成功数, 標本サイズ, 母集団成功数, 母集団サイズ)
カッコの中に4つの引数を指定します。
| 引数 | 説明 | 有効範囲 |
|---|---|---|
| 標本成功数(sample_s) | 標本内の成功数(ちょうど何個成功するか) | 0以上 |
| 標本サイズ(number_sample) | 標本のサイズ(何個抽出するか) | 0より大きく母集団サイズ以下 |
| 母集団成功数(population_s) | 母集団内の成功数(全体の成功要素数) | 0より大きく母集団サイズ以下 |
| 母集団サイズ(number_pop) | 母集団のサイズ(全体の要素数) | 0より大きい |
引数の流れは「標本→母集団」の順番です。まず「標本のなかで何個成功したか」「標本は何個か」を指定します。次に「母集団の成功数は何個か」「母集団は何個か」を指定する形ですね。
戻り値は「標本サイズ中、ちょうど標本成功数だけ成功する確率(確率質量)」です。0以上1以下の値が返ります。
TIP
引数に小数を指定すると、Excelは自動的に小数部分を切り捨てて処理します。意図しない結果を避けるため、最初から整数で指定するのが安心ですよ。
HYPGEOMDIST関数の基本的な使い方
実際にHYPGEOMDIST関数を使ってみましょう。「20枚のくじ(うち当たり3枚)から5枚引いて、当たりがちょうど1枚出る確率」を計算します。
=HYPGEOMDIST(1, 5, 3, 20)
このとき各引数は次のとおりです。
- 標本成功数=1(ちょうど1枚当てたい)
- 標本サイズ=5(5枚引く)
- 母集団成功数=3(全体の当たりは3枚)
- 母集団サイズ=20(くじは全部で20枚)
結果は約0.4605、つまり約46.05%の確率で「ちょうど1枚」当たると分かります。
セルに直接数値を書き込む代わりに、セル参照を使うこともできます。たとえばA2に1、B2に5、C2に3、D2に20を入れて、E2に次の数式を入力します。
=HYPGEOMDIST(A2, B2, C2, D2)
これなら、引数を変えるたびに結果が更新されるので、いろいろなパターンを試しやすいですよ。
超幾何分布と二項分布の違い(非復元 vs 復元)
HYPGEOMDIST関数を使うときに意識したいのが、超幾何分布と二項分布の違いです。どちらも「成功か失敗か」の確率を扱いますが、抽出方法が違います。
| 項目 | 超幾何分布(HYPGEOMDIST) | 二項分布(BINOMDIST) |
|---|---|---|
| 抽出方法 | 非復元抽出(戻さない) | 復元抽出(戻す) |
| 各試行の確率 | 試行ごとに変動 | 一定 |
| 母集団サイズ | 有限 | 無限または大きい |
| 用途 | 抜き取り検査・くじ引き・カード | コイン投げ・サイコロ・大量生産 |
非復元抽出は「引いたら戻さない」方法です。くじを引いた後そのくじを袋に戻さないので、残りのくじが減って毎回の確率が変わります。
復元抽出は「引いたら戻す」方法です。コインを投げるたびに同じ確率で表が出るのと同じで、各試行の確率は一定ですね。
使い分けの目安はこちらです。
- 母集団が小さい(数十〜数百)→ 超幾何分布(HYPGEOMDIST)
- 母集団が大きい(標本サイズの10倍以上)→ 二項分布で近似可能
- 「戻す/戻さない」が明確な場合は厳密にどちらかを選ぶ
抜き取り検査のように「ロットから戻さずに引く」場面はHYPGEOMDIST、コイン投げのように「毎回独立に試行する」場面はBINOMDIST、と覚えておくと迷いませんよ。
HYPGEOMDIST関数の実務での活用例(抜き取り検査)
HYPGEOMDIST関数の出番が多い場面のひとつが、品質管理の抜き取り検査です。ロット全体を検査するのは大変なので、一部を抜き取って合格・不合格を判定するときの確率計算に使います。
たとえば「100個の部品ロットから10個を抜き取り検査して、不良品が0個である確率」を求めてみます。前提として、ロットには5個の不良品が含まれていると仮定します。
=HYPGEOMDIST(0, 10, 5, 100)
結果は約0.5837、つまり約58.37%の確率で「10個中、不良品が0個」となります。
不良品が「ちょうど1個出る確率」も同じ要領で計算できます。
=HYPGEOMDIST(1, 10, 5, 100)
こちらは約34.39%です。
TIP
「不良品が1個以下である確率」のような累積確率を出したいときは、HYPGEOMDISTを足し合わせます。
=HYPGEOMDIST(0,10,5,100)+HYPGEOMDIST(1,10,5,100)で約92.76%が求まりますよ。新関数HYPGEOM.DISTなら、5番目の引数にTRUEを入れるだけで一発で出せます。累積確率を頻繁に使うなら新関数への移行がおすすめです。
抜き取り検査の合格判定(許容不良品数以下である確率)を出せば、ロットの合格率が見えてきます。検査計画の妥当性チェックや、サンプリング基準の見直しに活用できますよ。
HYPGEOMDISTでよくあるエラーと対処法
HYPGEOMDIST関数を使っていて遭遇しやすいエラーと、その原因・対処法をまとめました。
| エラー表示 | 主な原因 | 対処法 |
|---|---|---|
| #NUM! | 引数が有効範囲外(負の数、上限超過、大小関係が不正) | 引数の範囲を確認。標本成功数 ≤ MIN(標本サイズ, 母集団成功数) を満たすこと |
| #VALUE! | 引数が数値でない(文字列が入っている) | セル参照先の値を確認、数値に修正 |
| #NAME? | 関数名のスペルミス | HYPGEOMDIST(ピリオドなし)か HYPGEOM.DIST(ピリオドあり)かを再確認 |
特に多いのが#NUM!エラーです。「標本成功数が標本サイズより大きい」「母集団成功数が母集団サイズより大きい」など、論理的にあり得ない値を指定すると発生します。
たとえば =HYPGEOMDIST(5, 3, 2, 10) は#NUM!になります。標本サイズ3個から成功5個を取り出すことはできないからですね。
引数の有効範囲を整理するとこうなります。
- 標本成功数 ≥ 0 かつ 標本成功数 ≤ MIN(標本サイズ, 母集団成功数)
- 標本サイズ > 0 かつ 標本サイズ ≤ 母集団サイズ
- 母集団成功数 > 0 かつ 母集団成功数 ≤ 母集団サイズ
- 母集団サイズ > 0
この範囲を外れると#NUM!になるので、データ入力時にチェックを入れておくと安心ですよ。
HYPGEOMDISTとHYPGEOM.DISTの使い分け
旧関数HYPGEOMDISTと新関数HYPGEOM.DISTの使い分けの目安をまとめました。
HYPGEOMDIST(旧)を使う場面
- 既存の古いExcelファイルを保守する場合(数式を変更したくない)
- Excel 2007以前との互換性が必要な場合(xls形式で配布など)
- 確率質量だけ計算できればよい場面
HYPGEOM.DIST(新)を使う場面
- 新規にExcelファイルを作成する場合
- 累積確率(k個以下成功する確率)を計算したい場合
- 将来も長く使い続けるシートを設計する場合
迷ったときは新関数のHYPGEOM.DISTを選んでおけば間違いありません。Microsoftも公式に新関数を推奨していますし、累積確率まで一発で計算できるので応用範囲も広いんですよ。
NOTE
旧関数から新関数への移行は、
HYPGEOMDIST(a, b, c, d)をHYPGEOM.DIST(a, b, c, d, FALSE)に置き換えるだけで完了します。第5引数のFALSEは「確率質量を返す」という指定で、旧関数と同じ結果が得られます。
確率分布関数のシリーズ記事として、HYPGEOM.DIST関数の使い方、BINOM.DIST関数、GAMMADIST関数も合わせて読むと、Excelの統計関数全体の見通しがよくなりますよ。
まとめ:HYPGEOMDIST関数で非復元抽出の確率を計算しよう
ExcelのHYPGEOMDIST関数は、超幾何分布(非復元抽出)にもとづく確率を計算する旧関数です。本記事のポイントを振り返ります。
- HYPGEOMDISTは4引数で確率質量だけを計算する旧関数(互換性関数)
- 後継のHYPGEOM.DIST(5引数)は累積確率も計算できる
- 超幾何分布は「戻さずに引く」場面の確率分布で、二項分布(戻す)と区別する
- 抜き取り検査・くじ引き・カード抽選などの確率計算に活用できる
- #NUM!エラーは引数の有効範囲(標本成功数 ≤ MIN(標本サイズ, 母集団成功数) など)を確認する
- 新規ファイルでは新関数HYPGEOM.DISTを使うのがおすすめ
「戻さずに引く」場面の確率を、感覚ではなく数式で答えられるようになるとExcelの活用範囲がぐっと広がります。まずは身近なくじ引きや抜き取り検査で、HYPGEOMDIST関数の動きを試してみてくださいね。
