うお座効果は本当に存在するのか (3)

うお座効果に関するこれまでのエントリーは以下の通りです。

まず、オリンピック全競技者のメダリストの生まれ月・生まれ星座の分布について考えていきます。いきなり、水泳・水球のデータに飛びつかず、辛抱強くみていきましょう。

繰り返しになりますが、ここでメダリストといっているのは、誕生日が判明し ているメダリストのみです。

オリンピック全競技について、生まれ月、生まれ星座ごとのメダリストを、一様な誕生日分布を仮定したときの期待値とともに示します。

全競技の生まれ月ごとのメダリスト数と期待値(期待値は一様な誕生日分布を仮定した場合)
生まれ月1月2月3月4月5月6月
全競技メダリスト数204818821978178318471730
期待値(一様分布)1834.371671.641834.371775.201834.371775.20
生まれ月7月8月9月10月11月12月Total
全競技メダリスト数17861642176917341694172021613
期待値(一様分布)1834.371834.371775.201834.371775.201834.3721613

全競技における生まれ星座ごとのメダリスト数と期待値(期待値は一様な誕生日分布を仮定した場合)
生まれ星座ARITAUGEMCANLEOVIR
全競技メダリスト数197817831794180217431708
期待値
(一様分布)
1834.371834.371834.371834.371893.541775.20
生まれ星座LIBSCOSAGCAPAQUPISTotal
全競技メダリスト数17251647169618311986192021613
期待値
(一様分布)
1775.201775.201775.201716.021775.201789.9921613

ミッチェル氏は、生まれ星座の分布のみを示して、メダリストは、12月終わりから4月終わりまでの生まれが多いと言っていますが、生まれ月の分布に関し ては不正確な観察であり、上の生まれ月の分布を見ると、1月から3月が多いという傾向がみてとれます。このように、生まれ星座だけでなく、生まれ月のデータも示すべきなのです。

誕生日が一様に分布すると仮定したときの期待値に対して、メダリストの生まれ月/生まれ星座の分布がどれだけ偏りがあるかを カイ2乗適合度検定で計算してみると、この偏りは統計的に有意であることが分かります。

オリンピック全競技、すべての国のメダリストをひっくるめて扱った分布に対して、統計検定を施すことにはあまり意味がないと考えますので、偏りの度合 を示すカイ2乗値はあえて書いていません。

実際のところ、カイ2乗値(偏りの度合)はかなり大きな値になるのですが、これだけデータ多いと、カイ2乗値が大きくなるのは、よくあることであって、不思議なことではありません。ともかく誕生日の一様な分布に対しては、全メダリストの生まれ月/生まれ星座の分布は偏っていることは分かります。

しかし、 うお座効果は本当に存在するのか(1) で書いたように、スポーツ選手の生まれ月に偏りがあることはよく知られていることなので、偏りがあること自体は驚くべきことではありません。

問題は、このデータの統計検定の結果にどのような意味があるかどうかです。オリンピックは様々な国から異なるスポーツの競技者が参加します。スポーツ選手の生まれ月の分布は国やスポーツの種別によって異なることが想定されるので、多数の国から多様な種別の競技者が集まるオリンピックにおいて、全競技者のデータを十把一絡に扱って統計検定を行っても、その検定結果にどういう意味付けを与えられるは不明です。

そこで、次のエントリでは、国ごとのデータを見てみることにします。

コンテンツ連動型広告

Comments are closed.

SEO Powered by Platinum SEO from Techblissonline