みなさん,こんにちは
おかしょです.
制御工学を学習していくには数学的な知識が非常に重要になってきます.
センサーノイズの影響を抑制するためには確率統計学も勉強しておく必要があります.
この記事では,確率統計学を学び始めると最初に習う度数分布表について解説します.
この記事を読むと以下のようなことがわかる・できるようになります.
- 度数分布表とは何か
- 度数分布表の要素
- 相対度数とは
度数分布表とは
度数分布表とは,複数のデータを基に計算した相対度数などを書き記した表のことを言います.
例えば,数学のテストを50人の生徒に対して行ったとします.
50人の中には55点だった生徒や78点だった生徒がいます.
生徒それぞれがいろいろな点数を取っているので,点数を書き記された紙を見ただけでは何点をとった人がどのくらいいるのか,平均点はどのくらいなのかなどがわかりません.
度数分布表は生徒を点数ごとに分けて,どの点数をとった生徒が最も多いのかなどをわかるようにしてくれます.
以下では,度数分布表を実際に書きながら解説していきます.
階級とは
度数分布表を書くには,まず階級というものを決める必要があります.
この階級というのは,生徒を何点ごとのグループに分けるのかを表します.
例えば,50点未満の生徒と50点以上の生徒で分類したいのであれば,階級は以下の二つになります.
\[
0\leq x <50,\ 50\leq x \leq 100 \tag{1}
\]
ここで,\(x\)は生徒が取った点数を表します.
また,20点ごとに分類したい場合は,階級は以下のようになります.
$$ 0\leq x <20,\ 20\leq x <40,\ 40\leq x <60,\ 60\leq x <80,\ 80\leq x \leq 100 $$
このように,階級は自分がどのように分けてデータを見たいのか,どのようなデータを扱うのかによって自分で決定することができます.
今回は20点ごとに分けた場合を考えていきます.
階数値とは
階級が決まったら,各階級の階数値を求めます.
階級値とは,各階級の代表となる数値のことを言います.
ほとんどの場合,階級の中央となる値を使います.
先程の表に階級値を書き込むと以下のようになります.
度数とは
度数と言うのは階級ごとにいくつのデータがあるのかを表します.
今回のテストの結果の場合は,各点数ごとの生徒の人数を指します.
先程のデータを使って,度数を求めて先程の表に書き込むと以下のようになります.
度数は各階級にあるデータの数を表すので,すべての階級の度数を足し合わせると全体のデータ数になります.
今回の場合は,すべての度数の合計は50となります.
相対度数とは
次に相対度数を書き込みます.
相対度数とは,各階級にあるデータ数が全体に対してどのくらいの割合を占めるのかを表します.
相対度数を求める式は以下のようになります.
\[
相対度数=\frac{度数}{全体のデータ数} \tag{2}
\]
今回の例の場合は,全体のデータ数が50なので\(0\leq x <20\)の階級の相対度数は以下ようになります.
\[
\begin{eqnarray}
相対度数&=&\frac{12}{50}\\
&=& 0.24 \tag{3}
\end{eqnarray}
\]
この計算を各階級ごとに行うと,度数分布表は以下のようになります.
相対度数は合計すると,1.00になるので計算の見直す際に確認してみてください.
累積相対度数とは
最後に累積相対度数を求めます.
累積相対度数というのは,ある階級以下の相対度数の合計のことを言います.
例えば,\(60\leq x <80\)の階級の累積相対度数は以下のようにして求められます.
\[
\begin{eqnarray}
累積相対度数&=&(0\leq x <20の相対度数)+(20\leq x <40の相対度数)+(40\leq x <60の相対度数)+(60\leq x <80の相対度数)\\
&=& 0.24+0.32+0.18+0.18\\
&=& 0.92 \tag{4}
\end{eqnarray}
\]
このようにして,他の階級も累積相対度数を求めると以下のようになります.
累積相対度数は最後の階級の値が必ず1.00になります.
まとめ
この記事では度数分布表の書き方について解説しました.
度数分布表は中学校でも習うような基本的な内容ですが,計算自体は単純でも用語については忘れている方もいるかと思います.
私は大学生の時には忘れていました.
この度数分布表だけではデータの分布がわかりずらい場合は,ヒストグラムというグラフを使うとより分かりやすくなります.
ヒストグラムというのは,横軸に階級,縦軸に度数をとった棒グラフのことを言います.
度数分布表が掛ければ非常に簡単に書くことができるので,皆さんも試してみてください.
続けて読む
この記事で解説した度数分布表が理解できたら,以下で解説している平均値や分散の求め方を理解しましょう.
データの解析において平均値や分散,標準偏差は非常に役に立ちます.
Twitterでは記事の更新情報や活動の進捗などをつぶやいているので気が向いたらフォローしてください.
それでは最後まで読んでいただきありがとうございました.
コメント