2016年08月27日

データの変動と分散についてまとめてみた /データ分析の解説

データのばらつきの大きさをみる一つの方法に、平均値との差をとってみる方法があります。
20140923_0.jpg

平均値との差が大きい方がばらつきが大きい。平均値との差が小さい方がばらつきが小さいと言うことができます。
20160827_01.jpg

ただ、この平均値との差を足し合わせてしまうとどんな場合も"0"になってしまいます。
20160827_04.jpg

そこで、データと平均値の差がマイナスの符号をプラスにしてやれば差の合計が0にならず大きさを比較することができます。
差がマイナスにならないようにするには、2つの方法があって、1つは絶対値をとる方法ともう一つは差を二乗してしまう方法です。ここで、差を二乗して足し合わせたものを"データの変動"と言います。
20160827_02.jpg

絶対値の和にしても差の二乗和にしてもデータの数が異なると比較できないので、データの個数で割った平均値をばらつきとします。
ここで、絶対値の和の平均を平均偏差、差の二乗和の平均を分散といいます。
20160827_03.jpg

ExcelではVARP関数で分散を求めることが出来ます。

次回は標準偏差についてまとめてみました。
20150222_01.jpg





関連ページ
分散と標準偏差(ばらつき)についてまとめてみた
お母さんの必見!わが子の偏差値とz値とは
相関関係についてまとめてみた
VARP関数で分散を求めてみた
COVAR関数で共分散を求めてみた


データ分析の解説/メニュー
posted by haku1569 at 18:28| データ分析の解説 | このブログの読者になる | 更新情報をチェックする