2019年08月15日

夏休みの自由研究風に気温とビールの売れた本数の関係を調べてみた-1 / データ分析の解説

近所の酒屋さんのビールの売れた本数はやっぱ暑くなると増えるのかな〜〜?
「暑さとビールの売れた本数の関係について」と言うのが、難しく言うと相関関係があるかどうかと言うことになります。
ここで、予め断っておきますが、このテーマ見た時にみんな気温が上がると酒屋さんのビールの売れる本数は増えると思いますよね。まぁ、確かにその通りなんです。
そして、その時ビールが売れると気温が上がると思う人はいないですよね。つまりどちらが原因かと言うと、気温だってみんな思うよね。何故なら、気温は自然現象でビールの売れる本数は人間の消費行動だから。。。
これは、例題なのでこんなテーマだけど、実際に関係が有るのか無いのかを調べる時ってこんな明らかな状態にはなっていないので先入観を持たないで調べていくことが大切です。

まず、気温とビールの売れた本数を表にしてみました。その日の天気もお天気マークで記入したら一挙に夏休みの自由研究風になりました。(^_-)-☆
ていうか、酒屋のおじさん曰く、ビールの売れ行きは気温だけじゃなくて、天気や曜日によっても変わるっていう話。。。
そして、気温とビールの本数の平均も計算して記入してみました。
20190815_02.jpg

これを、棒グラフにしてみました。
平均値も点線で書き加えてみました。
20190815_03.jpg

するとやっぱ、気温が上がるとビールの本数も増えているようなグラフになってるよねー。
気温が低い日から順に並び変えてみたら見やすくなるんじゃないかなーと思ってグラフを描き直してみました。
20190815_04.jpg

そうしたら、思っていた通り気温が上がるとビールの本数も増えているのが分か安いグラフが出来上がりました。
「暑さとビールの売れた本数の関係について」は気温が上がるとビールの売れた本数も増えるという関係になるのが分かりました。
おしまいっ!
と、ここまでだとホントの夏休みの自由研究だよねー。
なんせ、今どきの小学生は負の数は習わないし、グラフと言うと棒グラフ、折れ線グラフに円グラフ。。。

気温と、ビールの本数をで点を描いて分布をみる散布図習うのは高校生だからねー。。。
別に、「散布図」なんていう言葉や定義は要らないから、問題を解決するためのグラフとしてこんなのもあるよと言うのを教えておいてもいいと思うけどなー。

と、それはさておき、、、

ところで、気温とビールの売れた本数の間の関係ってどんなのがあるか?
平均より上か下かで分けてまとめると3種類の関係があることが分かります。
@気温が上がるとビールの本数が増える
 今回の結果です。
A気温が上がるとビールの本数が減る関係
 たぶんこんなことはないと思うけど例えば気温と温かい飲み物とかだったらこんな関係になると思いました。
B気温が上がるとビールの本数が増えたり減ったりする、それとか全然変わらない関係。
これって、関係ないってことだよね。って、これも関係の内かな。。。
20190815_01.jpg図4

今回調べたビールの本数は@の気温が上がるとビールの本数が増える関係だから、気温が平均より低い時はビールの本数も平均より少なくて、気温が平均より高い時はビールの本数も平均より多くなっている。

あれ?でも23日と21日はそうじゃないなー。。。
23日は、気温は平均よりちょっと低いけどビールの本数は平均よりちょっと多い。
21には、気温は平均よりちょっと高いけどビールの本数は平均より少ない。。。
まぁ、これは、たまたま?ばらつき?か、天気や曜日や気温以外の何かがビールの本数に影響をしてたのかもしれない。

んで、これを、横(右方向)が気温、縦(上方向)がビールの本数とした四角にそれぞれの平均と比較しながらそれぞれの範囲をイメージで描いてみます
こんな感じ?
こんな、適当な範囲で図にしたのはたまたまがあるから。。。
20190815_05.jpg

それじゃ、この四角に実際の調べた気温とビールの本数を縦横の交わるところに点(〇)を描いてってみます。
これが高校の数学Tで習う“散布図”ってやつ。
しかし、学校で習うことって面白くないよねー(あっ、個人的な感想です)。(x,y)とか出てくるでしょ?なにそれっ!xって何!?って思った!
目的がないと言うか、教えることが目的だからねー。
これみたく、気温とビールの売れた本数の関係を調べるためって言う目的がないじゃない?

そんでだ、とにかく描くとこんなのができます。
気温と本数のそれぞれの平均の上か下かで分けるとA、B、C、Dの4つの範囲に分けられます。
気温が平均より低いときを“涼しい”、高いときを“ι(´Д`υ)アツィー”として、ビールの本数が平均より少ないときを“売れない”多いときを“売れた”と言うと。。。
(実際に涼しいかどうかは別だよ、それに平均より少なくてもビールは売れてるからね、けど、そう言った方が分かりやすいでしょ?)
A:涼しかったけどビールが売れた
B:暑くてビールが売れた
C:暑かったけどビールが売れなかった
D:涼しいからビールが売れなかった
ね、ここでも“から”とか“けど”とか関係を誘導するような作為的な表現をしてるでしょ?
こんなのに騙されちゃダメだよ!
20190815_06.jpg

気温が上がるとビールの本数も増える関係なら、全てBとDの範囲に入っていればいいと思うのですが、21日はC、23日はAに入ってるのがわかる。

ここまでで、調べた気温と売れたビールの本数の整理とまとめが完了です!
次回はいよいよもっと深く関係を調べていきましょう!分析だよー!


関連ページ
データ分析の解説 / メニュー

分かりにくい解説
相関関係についてまとめてみた
相関関係で気をつけたいこと(散布図を画いて確認しよう!)
散布図についてまとめてみた(どっちが横軸?)
相関関係と因果関係、疑似相関と潜在変数についてまとめてみた


お酒は二十歳を過ぎてから!







[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

アサヒ スーパードライ 500ml×1ケース(24本)《024》
価格:6750円(税込、送料別) (2019/8/16時点)












posted by haku1569 at 20:01| データ分析の解説 | このブログの読者になる | 更新情報をチェックする