こんにちは!のーちです。
このシリーズでは、QC検定の資格取得を目指して学習をしている私が、学習した内容を備忘録として配信しています。
前回の記事では統計のサンプリングについて学習しました。
4回目の今回は「確率変数の期待値」について記事にしました。
確率変数の期待値について知ることは、統計学やQC(Quality Control)を考える上で非常に重要な内容です。
今回の内容もQC検定の試験で必出の項目ですので、しっかり理解したいですね!
- 確率変数とはなにか
- 確率変数の期待値とはなにか
- 期待値の性質
- QC検定での出題パターン
確率変数とは
確率変数とは、値と確率が対応している変数のことです。
いつものようにサイコロを例に考えていきます。
サイコロのそれぞれの値と、その値が出る確率を表にしました。
このようにサイコロの目とその発生確率は対応しているので、サイコロの出る目の値は確率変数といえます。
ここでサイコロの目の値をXとおいて、上の表の関係を式に表すとこのように書けます。
$$P(X) = \frac{1}{6} \ \ \{\ X=1,2,3,4,5,6 \}\ $$
右側のカッコはXの取り得る値です。例えはX=3のとき、3が出る確率は1/6であることを表しています。
$$P(X=3)= \frac{1}{6}\ $$
ここで1つ注意したいことがあります。それはサイコロの例は離散型の確率変数であるということです。
離散型とは隣り合う数字の間が存在しないことで、サイコロの目の場合1の次は2その次は3・・・最後は6で3.5や5.8などは存在しません。
これに対して身長などは150cmと151cmの間には151.01cmや151.00185cmなど値が無数に存在します。
このような場合の確率変数を連続型確率変数といいます。
確率分布とは
確率変数が取る値と、その値の発生確率の対応関係を確立分布といいます。
サイコロの例で、それぞれの値とその発生確率をグラフにしてみました。
このような、値と確率の分布が確立分布です。
確立分布において、確率の合計は必ず1になります。
サイコロの例も確率の合計は\(\frac{1}{6}+\frac{1}{6}+\frac{1}{6}+\frac{1}{6}+\frac{1}{6}+\frac{1}{6}=1\)になることが分かります。
サイコロのように離散型の確率変数がとる分布を離散型確率分布といいます。
身長の様な連続型確率変数の分布は連続型確率分布といいます。
連続型確率分布では離散型と異なり、「身長が170cmの確率は1/10」などということができません。
なぜなら身長が取り得る値は170.0098や170.00000001など無限に存在し、それらを全て足し合わせた値が1になるので、ある1つの値が取り得る確率は\(\frac{1}{∞}=0\)になってしまうからです。
$$P(X=170)= \frac{1}{∞} = 0\ $$
なので、連続型確率分布では確率密度という考え方を使い、身長169cm以上170cm以下などとして範囲での確率を考えます。
連続型確率分布をグラフで表すと下図のように曲線になり、この曲線を表す関数を確立密度関数といい、X軸と確率密度関数で囲まれた部分の面積が確立になります。
面積は積分で求めることができ、確率密度分布の全範囲の面積は1になります。
$$ \displaystyle \int_{-\infty}^{ \infty } f(x) dx=1\ $$
期待値とは
確率変数の期待値とは、確率分布の中心を表す値(平均値)のこと。ただし、普段考えるようなデータの平均値とは違い、確率変数の期待値(平均値)は、確率変数がとる値にその発生確率をかけて、全て足し合わせた値です。
またサイコロの例で考えて見ます。
サイコロの目の値の平均値(データの平均値)は次のように計算できます。
$$ (1+2+3+4+5+6)\div 6 $$
一方、確率変数の期待値(隔離変数の平均値)は次のように計算できます。
$$ 1 \times \frac{1}{6} + 2 \times \frac{1}{6} + 3 \times \frac{1}{6} + 4 \times \frac{1}{6} + 5 \times \frac{1}{6} + 6 \times \frac{1}{6} $$
サイコロの目の場合、どちらも計算結果が3.5になりますが、それぞれの数値の意味は全く異なりますので、混同しないように確率分布の中心を表す値は期待値と言った方がいいでしょう。
確率変数Xの期待値はE(X)と表します。(EはExpectationの頭文字)
E(X)を使って、サイコロの例は次のように表されます。
$$ E(X) = 1 \times \frac{1}{6} + 2 \times \frac{1}{6} + 3 \times \frac{1}{6} + 4 \times \frac{1}{6} + 5 \times \frac{1}{6} + 6 \times \frac{1}{6} $$
期待値の性質
X,Yが確立変数、a,bが定数のとき、期待値には次のような性質があります。
$$\begin{eqnarray} & & E(aX)=aE(X) \\[ 5pt ] & & E(X+b)=E(X)+b \\[ 5pt ] & & E(X+Y)=E(X)+E(Y) \\[ 5pt ] & & E(X-Y)=E(X)-E(Y) \\[ 5pt ] \end{eqnarray}$$それぞれについて解説します。
\( \small{ E(aX)=aE(X)} \)
この式は、確率変数に定数をかけたときの期待値は、元の確率変数の期待値に定数をかけたものと等しいことを表しています。
サイコロの例で、サイコロの出た目に2をかけたときの期待値を考えます。
出た目に必ず2をかけるので、値はそれぞれ1×2, 2×2, 3×2, 4×2, 5×2, 6×2となります。それぞれの目が出る確率は変わらないので、表にすると次のようになります。
この確率変数の期待値を計算すると
$$ E(X)= 2 \times \frac{1}{6} + 4 \times \frac{1}{6} + 6 \times \frac{1}{6} + 8 \times \frac{1}{6} + 10 \times \frac{1}{6} + 12 \times \frac{1}{6} = 7 $$
となります。
一方で、もともとの確率変数の期待値に2をかけた値は
$$ E(X)+2=(1 \times \frac{1}{6} + 2 \times \frac{1}{6} + 3 \times \frac{1}{6} + 4 \times \frac{1}{6} + 5 \times \frac{1}{6} + 6 \times \frac{1}{6}) \times 2=7 $$
となり、どちらの場合も7であることから\( E(aX)=aE(X) \)が成り立つことが分かります。
\( \small{ E(X+b)=E(X)+b} \)
この式は、確率変数に定数を足したときの期待値は、元の確率変数の期待値に定数を足したものと等しいことを表しています。
サイコロの例で、サイコロの出た目に2を足したときの期待値を考えます。
出た目に必ず2を足すので、値はそれぞれ1+2, 2+2, 3+2, 4+2, 5+2, 6+2となります。それぞれの目がでる確立は変わらないので、表にすると次のようになります。
この確率変数の期待値を計算すると
$$ E(X)=3 \times \frac{1}{6} + 4 \times \frac{1}{6} + 5 \times \frac{1}{6} + 6 \times \frac{1}{6} + 7 \times \frac{1}{6} + 8 \times \frac{1}{6} = 5.5 $$
となります。
一方で、もともとの確率変数の期待値に2を足した値は
$$ E(X)+2=1 \times \frac{1}{6} + 2 \times \frac{1}{6} + 3 \times \frac{1}{6} + 4 \times \frac{1}{6} + 5 \times \frac{1}{6} + 6 \times \frac{1}{6} +2=5.5 $$
となり、どちらの場合も5.5であることから\( E(X+b)=E(X)+b \)が成り立つことが分かります。
\( \small{ E(X+Y)=E(X)+E(Y)} \)
この式は、確率変数の和の期待値は、それぞれの確率変数の期待値の和と等しいことを表しています。
2つのサイコロを振って、出た目を足した場合の期待値を考えます。
2つのサイコロを振って、出た目を足したときの確率変数は次のようになります。
この確率変数の期待値を計算すると
$$ \begin{eqnarray} E(X)=2 \times \frac{1}{36} + 3 \times \frac{2}{36} + 4 \times \frac{3}{36} + 5 \times \frac{4}{36} + 6 \times \frac{5}{36} + 7 \times \frac{6}{36} \\ + 8 \times \frac{5}{36} + 9 \times \frac{4}{36} + 10 \times \frac{3}{36} + 11 \times \frac{2}{36} + 12 \times \frac{1}{36} =7 \end{eqnarray} $$
となります。
サイコロ1つずつの確率変数を足した値は
$$ E(X)+E(Y) =3.5+3.5=7 $$
となり、どちらの場合も7であることから\( E(X+Y)=E(X)+E(Y) \)が成り立つことが分かります。
\( \small{ E(X-Y)=E(X)-E(Y) } \)
この式は、確率変数の差の期待値は、それぞれの確率変数の期待値の差と等しいことを表しています。
サイコロの例で、2つのサイコロを振って、出た目の差の期待値を考えます。
2つのサイコロを振って、出た目を足したときの確率変数は次のようになります。
この確率変数の期待値を計算すると
$$ \begin{eqnarray} E(X)=(-5) \times \frac{1}{36} + (-4) \times \frac{2}{36} + (-3) \times \frac{3}{36} + (-2) \times \frac{4}{36} + (-1) \times \frac{5}{36} \\ + 0 \times \frac{6}{36} + 1 \times \frac{5}{36} + 2 \times \frac{4}{36} + 3 \times \frac{3}{36} + 4 \times \frac{2}{36} + 5 \times \frac{1}{36} =0 \end{eqnarray} $$
となります。
2つのサイコロの確率変数の差は
$$ E(X)-E(Y)=3.5-3.5=0 $$
となり、どちらの場合も0であることから、\( E(X-Y)=E(X)-E(Y) \)が成り立つことがわかります。
QC検定では期待値についてどんなことが出題されるか
QC検定では期待値について次のような問題が出題される可能性があります。
X,Yを確立変数、a,bを定数として
(1)\(E(aX+b)\) を計算せよ
(2)\(E(aX-bY)\) を計算せよ
(3)\(E(\frac{1}{a}X+\frac{1}{b}Y)\) を計算せよ
解答
(1)\( aE(X)+b \)
(2)\( aE(X)-bE(Y) \)
(3)\( \frac{1}{a}E(X)+\frac{1}{b}E(Y) \)
まとめ
確率変数の期待値は、QC検定の設問を解くのに必要な知識なので、覚えておきたいですね。
特に期待値の性質は、この後の学習内容で式変形をする際に登場するので忘れないようにしましょう。
コメント