みなさん,こんにちは
おかしょです.
確率統計学を勉強しているとチェビシェフの不等式というよくわからない名前の数式を目にします.
この記事ではそのチェビシェフの不等式とは何か,さらにその証明について解説しています.
この記事を読むと以下のようなことがわかる・できるようになります.
- チェビシェフの不等式とは
- チェビシェフの不等式の証明
この記事を読む前に
チェビシェフの不等式は確率変数に関する不等式です.
確率変数とは何なのかわからない方は以下の記事で詳細に解説しているので,そちらを先に読んでおくことをおすすめします.
チェビシェフの不等式とは
数値のデータで与えられている情報が平均値と分散だけであった場合を考えます.
平均値はデータの代表となりうる値のことで,分散はデータの揺らぎを表しています.
平均値から分散を超える値はデータの中には少ないのですが,どのくらいの確率で分散を超えるようなデータが含まれるのかがわかりません.
分散を超える値の確率が高い場合,データのばらつきが多くて困ってしまいます.
ただ,確率が高ければそれなりの対処ができるのでどのくらいの確率なのかを知る必要があります.
そんな確率を不等式として求めることができるのが,このチェビシェフの不等式です.
図で表すと,以下のように「確率変数Xが平均値を\(\bar{X}\)とすると,\(\bar{X}-\varepsilon\leq X \leq \bar{X}+\varepsilon\)の区間の外に値をとる確率」を不等式で表せます.
数式で表すと以下のようになります.
$$ P(X\neq \bar{X}-\varepsilon\leq X \leq \bar{X}+\varepsilon) \leq \frac{V(X)}{\varepsilon^2} $$
もっとわかりやすく書くと以下のように書けます.
$$ P(|x-\bar{X}|\geq \varepsilon) \leq \frac{V(X)}{\varepsilon^2} $$
このチェビシェフの不等式によって,範囲を指定して確率を求めることができます.
次は,なぜこのような不等式が成り立つのかを考えていきます.
チェビシェフの不等式の証明
まずは分散V(X)はどのように求めていたのかをおさらいします.
分散V(X)は以下の式で求められました.
$$ V(X) = \displaystyle \int_{-\infty}^{ \infty } (x-\bar{X})^{2} p(x) dx $$
このように分散V(X)はすべての範囲で積分をします.
先程のチェビシェフの不等式で使用した範囲\(|x-\bar{X}|\geq \varepsilon\)で積分をした場合と比較すれば,当然,すべての範囲で積分した方が数値は大きくなります.
$$ V(X) = \displaystyle \int_{-\infty}^{ \infty } (x-\bar{X})^{2} p(x) dx \geq \displaystyle \int_{|x-\bar{X}|\geq \varepsilon}^{ } (x-\bar{X})^{2} p(x) dx $$
ここで,上の不等式の右辺の被積分項\(x-\bar{X}\)は必ず\(\varepsilon\)よりも小さくなるので,\(\varepsilon\)に置き換えても不等式は成り立ちます.
$$ V(X) \geq \displaystyle \int_{|x-\bar{X}|\geq \varepsilon}^{ } \varepsilon^{2} p(x) dx $$
したがって,この式を整理していくと
\begin{eqnarray}
V(X) &\geq& \displaystyle \int_{|x-\bar{X}|\geq \varepsilon}^{ } \varepsilon^{2} p(x) dx\\
&\geq&\varepsilon^{2} \displaystyle \int_{|x-\bar{X}|\geq \varepsilon}^{ } p(x) dx\\
&\geq&\varepsilon^{2} P(|x-\bar{X}|\geq \varepsilon)\\
P(|x-\bar{X}|\geq \varepsilon)&\leq& \frac{V(X)}{\varepsilon^2}
\end{eqnarray}
となり,チェビシェフの不等式と一致します.
まとめ
この記事ではチェビシェフの不等式の解説と証明を行いました.
チェビシェフの不等式は確率統計学において非常に重要な役割を果たします.
このチェビシェフの不等式を知っていれば,ある範囲外の値をとる確率がわかるのでデータの解析などができます.
ぜひ覚えておきましょう.
続けて読む
確率統計学において,チェビシェフの不等式と同じくらい重要な同時分布と周辺分布について以下の記事で解説しています.
確率統計学を学習している方は続けて参考にしてください.
Twitterでは記事の更新情報や活動の進捗などをつぶやいているので気が向いたらフォローしてください.
それでは最後まで読んでいただきありがとうございました.
コメント