ビジネスの現場において、売上の予測や品質管理、リスク評価を行う際、避けて通れない概念が「正規分布」です。一見すると難解な数式に見えますが、その本質は「バラつきのルールを可視化し、確率的に判断すること」にあります。本稿では、正規分布の仕組みと、zスコアを用いた実践的な活用方法について解説します。
1. 「分布」とは何か:データの個性を捉える
統計学における「分布(度数分布)」とは、集めたデータが「どの値に、どれくらいの頻度(度数)で存在するか」を整理したものです。
ビジネスでデータを扱う際、平均値だけを見るのでは不十分です。例えば、同じ「平均売上100万円」でも、毎日安定して100万円売れる店舗と、0円の日と200万円の日が激しく入れ替わる店舗では、リスクの質が全く異なります。この「データの散らばり具合」を可視化したものが分布です。
通常、横軸にデータの値、縦軸にその発生頻度をとって「ヒストグラム」を作成することで、データの「中心(どこに集まっているか)」と「広がり(どれくらいバラついているか)」を視覚的に捉えることができます。
2. 正規分布とは何か:バラつきを可視化する「釣鐘」の法則
世の中の多くの現象(製品の寸法、テストの点数、1日の来店客数など)は、平均値付近にデータが最も多く集まり、平均から離れるほど緩やかに頻度が減っていく、左右対称の「釣鐘(つりがね)」のような形を描きます。これを正規分布と呼びます。
この分布には以下の重要な指標が存在します。
- 平均値 (μ):データの中心。
- 標準偏差 (σ):データの「バラつき」を示す尺度。
正規分布の最大の特徴は、平均値からの距離(標準偏差の何倍離れているか)が決まれば、その範囲に含まれるデータの割合(確率)が数学的に決まっている点です。
- 平均 ± 1σ の範囲内:全体の約 68.27%
- 平均 ± 2σ の範囲内:全体の約 95.45%
- 平均 ± 3σ の範囲内:全体の約 99.73%
3. 標準化とzスコア:異なるデータを同じ尺度で測る
単位や平均値が異なるデータ群(例:売上金額と顧客満足度)を比較・分析するために、「標準化」という手法を用います。すべての分布を「平均値 = 0、標準偏差 = 1」という共通の指標(標準正規分布)に変換した値を zスコア と呼びます。
【zスコアの計算式】
$$z = \frac{x – \mu}{\sigma}$$
(x: 測定値, μ: 平均値, σ: 標準偏差)
この zスコアを算出することで、「集団の中でその数値がどれくらい珍しいものか」を客観的に評価でき、次に説明する「正規分布表」を使って正確な確率を導き出せるようになります。
4. 正規分布表から確率を求める方法
「標準正規分布表」は、zスコアに対応する面積(確率)を一覧にまとめたものです。
標準正規分布表(抜粋)
以下は、平均(z = 0)から特定の z までの面積(確率)を示す表の抜粋です。
| zスコア | 0.00 | 0.01 | 0.02 | 0.03 | 0.04 | 0.05 | 0.06 | 0.07 | 0.08 | 0.09 |
|---|---|---|---|---|---|---|---|---|---|---|
| 0.0 | .0000 | .0040 | .0080 | .0120 | .0160 | .0199 | .0239 | .0279 | .0319 | .0359 |
| 1.0 | .3413 | .3438 | .3461 | .3485 | .3508 | .3531 | .3554 | .3577 | .3599 | .3621 |
| 1.6 | .4452 | .4463 | .4474 | .4484 | .4495 | .4505 | .4515 | .4525 | .4535 | .4545 |
| 2.0 | .4772 | .4778 | .4783 | .4788 | .4793 | .4798 | .4803 | .4808 | .4812 | .4817 |
表の読み方の手順
- zスコアを計算する: 上記の式で z の値を求めます(例:z = 1.65)。
- 行(縦軸)を見る: z の小数第1位までの数値(1.6)を探します。
- 列(横軸)を見る: z の小数第2位の数値(0.05)を探します。
- 交点を確認する: 行と列が交わる箇所の数値(.4505)が、その zスコアに対応する面積です。
これは「平均から 1.65 σ までの間に、全データの 約45.05% が含まれる」ことを意味します。
5. 実践ケーススタディ:在庫管理における欠品リスクの最適化
課題:欠品率を5%以下に抑えたい
ECサイトで、ある商品の1日の販売数が「平均 50個、標準偏差 10個」の正規分布に従うとします。翌日の在庫を何個用意すれば、欠品する確率を 5% 以下に抑えられるでしょうか?
計算ステップ
- 目標確率の設定: 「欠品率 5% 以下」ということは、言い換えれば「全データの 95% をカバーする在庫数」を求めることになります。
- zスコアの特定: 正規分布は左右対称なので、全体の 95% をカバーするには「中心より左側(50%)」+「中心より右側(45%)」の地点を探します。 表で面積が
.4500(45%)に最も近い箇所を探すと、z ≒ 1.65 となります。 - 元の単位(個数)への逆算: $$x = \mu + (z \times \sigma)$$$$x = 50 + (1.65 \times 10) = 66.5$$
意思決定
計算の結果、67個 の在庫を用意しておけば、統計的に 95% の日は欠品せずに済むことが導き出されました。
まとめ:データで判断するための「共通言語」
正規分布は、単なる数学上の理論ではありません。
- バラつきを正しく見積もること
- リスクと成功確率を定量化すること
- 目標達成に必要な条件を逆算すること
これらを行うための、zスコアと正規分布表はビジネスリーダーが備えておくべき強力な「武器」です。曖昧な現場の課題を、論理的かつ実行可能なビジネスプランへと昇華させるために活用しましょう。