- 2008-09-07 (Sun) 15:52
- 統計
うお座効果に関するこれまでのエントリーは以下の通りです。
前回のエントリ「うお座効果は本当に存在するのか(5)」では、英国メダリストの生れ月分布に関して、一様な誕生日分布に対してもつ偏りと、英国国民の実際の生まれ月分布に対してもつ偏りを比較しました。結果として、一様な誕生日分布に対する偏りは統計的に有意であるにもかかわらず、英国国民の実際の生まれ月分布に対する偏りはより小さく、統計的に有意ではないということが分かりました。
ある国のメダリストの生まれ月分布が、誕生日の一様分布に対してよりも、その国の国民の生れ月分布方に対してより適合するというのは自然なことなので、これは当然の結果です。また、一様な誕生日分布を使って検出される微妙な有意性は、疑ってかかるべきであるということも言えます。
誕生月分布の実測値は手に入れることが難しく、今回の調べた範囲では英国と日本のデータのみを見つけることができました。英国では、以上の結果であったわけですが、日本ではどうなのでしょう。
そこで、以下の日本国民の誕生月分布を使って、1901年から1984年生まれの日本国民の月別誕生数の平均値を求めました。その平均値に基づいて計算される期待値に対して、これまでオリンピック全競技における日本のメダリストの生まれ月分布がどれほど偏っているかを調べました。
次に、カイ2乗適合度検定を使って、日本のメダリストの生まれ月分布の偏りを調べた結果を示します。一番目の表が、一様な誕生日分布に対する偏りで、2番目の表が、1901年から1984年生まれの日本国民の生れ月分布に対する偏りです。
| 生まれ月 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | |
|---|---|---|---|---|---|---|---|
| 日本メダリスト数 | 45 | 43 | 37 | 25 | 41 | 33 | |
| 期待値(一様分布) | 40.99 | 37.36 | 40.99 | 39.67 | 40.99 | 39.67 | |
| 生まれ月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | Total |
| 日本メダリスト数 | 41 | 37 | 51 | 43 | 39 | 48 | 438 |
| 期待値(一様分布) | 40.99 | 40.99 | 39.67 | 40.99 | 39.67 | 40.99 | 483.00 | カイ2乗値 = 13.11、p = 0.286 |
| 生まれ月 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | |
|---|---|---|---|---|---|---|---|
| 日本メダリスト数 | 45 | 43 | 37 | 25 | 41 | 33 | |
| 期待値(1901–1981) | 53.58 | 44.55 | 49.85 | 37.19 | 35.53 | 32.93 | |
| 生まれ月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | Total |
| 日本メダリスト数 | 41 | 37 | 51 | 43 | 39 | 48 | 438 |
| 期待値(1901–1981) | 36.76 | 38.12 | 38.96 | 39.38 | 39.31 | 36.84 | 483.00 | カイ2乗値 = 17.54、p = 0.0929 |
5%の有意水準でみたときに、いずれも統計的に有意な偏りとは言えないことが分かります。それはそれでよいのですが、 一つ不思議なことに気づきます。偏りの度合(カイ2乗値)をみると、日本国民の1901–1984 年の生れ月分布に対する偏りの方が、一様な誕生日分布に対する偏りも大きいのです。普通に考えると、日本のメダリストの生まれ月分布は、日本国民の生まれ月分布の実測値の方により合致するはずなんですが、逆の結果が得られてしまいました。
さらに調べてみて理由が分かりました。日本国民の生まれ月分布は、年代によって大きく変化しているようです。にもかかわらず、1901年から1984年生まれという長期間の月別誕生数をひとくくりに扱ったので、こういう結果になってしまったのでした。
以下において、年代を区切ったデータを示します。最初が、1901年から1941年生まれの日本のメダリスト(全競技)に関して、メダリストの生まれ月分布と一様な誕生日分布に基づく期待値を比較した表、メダリストの生まれ月分布と日本国民の1901–1940 年の生れ月分布に基づく期待値を比較した表、メダリストの生まれ月分布/一様な誕生日分布/日本国民の1901–1940 年の生れ月分布を同時に示したグラフです。続いて、1941–1960年生まれのメダリスト、1961–1980年生まれのメダリストに関して、同様のデータを示しています。
まず、各年代とも、日本のメダリストの生まれ月分布は、一様な誕生日分布に対しても、日本国民の実際の生れ月分布に対しても、有意な偏りはないということが分かります(有意水準=5%)。
第二に、各年代とも、日本のメダリストの生まれ月分布は、一様な誕生日分布に対してよりも、日本国民の実際の生れ月分布に対しての方が、偏り(カイ2乗値)がより小さくなっているか、あるいは、ほぼ等しくなっていることが分かると思います。1961年から1980年生まれのメダリストに関しては、一様な誕生日分布に対しての偏りの方がわずかに小さくなっていますが、これは、日本国民の1961–1980年の生れ月分布に対する偏りとほぼ等しいといってよい値です。
このように、年代別に区切ってみれば、メダリストの生まれ月分布は、一様な誕生日分布よりも、実際の生まれ月分布の方により適合する、あるいは、同程度に適合するという、直観に合った結果が得られるわけです。
これと関連して、第三に、各年代ごとの日本国民の生まれ月分布(グラフでは緑色のライン)を一様な誕生日分布(グラフでは灰色のライン)と比べると、日本国民の生まれ月分布は、年代によって随分変化していることが分かります。1901年から1940年生まれは、1月から3月の生まれが多いという傾向があります。その傾向は、1941年から1960年生まれまでは、やや残っていますが、1961年から1980年生まれなると、その傾向が消失して、一様な誕生日分布とそれほど変わらなくなっています。
これくらい年代によって国民の生まれ月分布が変化するとなると、長期間にわたってメダリストの生れ月を集計して考察しても、必ずしも意味をなさない場合があることが分かります。
こうした日本国民の生まれ月分布の変化は、日本人のライフスタイルの変化と密接に関係しているのだと思われます。こういった現象は、日本に特有なもののか、他の国でも見られるものなのかは分かりませんが、生まれ月の分布の偏りを議論することに慎重さが必要とされることは、分かっていただけたのではないかと思います。
次回は、やっと、水泳と水球のメダリストの分布についてみていくこととします。
| 生まれ月 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | |
|---|---|---|---|---|---|---|---|
| 日本メダリスト数 (1901–1940) | 14 | 13 | 6 | 2 | 11 | 4 | |
| 期待値(一様分布) | 8.57 | 7.81 | 8.57 | 8.30 | 8.57 | 8.30 | |
| 生まれ月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | Total |
| 日本メダリスト数 (1901–1940) | 8 | 5 | 11 | 8 | 9 | 10 | 101 |
| 期待値(一様分布) | 8.57 | 8.57 | 8.30 | 8.57 | 8.30 | 8.57 | 101.00 | カイ2乗値 = 18.09、p = 0.0795 |
| 生まれ月 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | |
|---|---|---|---|---|---|---|---|
| 日本メダリスト数 (1901–1940) | 14 | 13 | 6 | 2 | 11 | 4 | |
| 期待値(1901–1940) | 12.25 | 9.98 | 11.95 | 7.15 | 6.88 | 6.20 | |
| 生まれ月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | Total |
| 日本メダリスト数 (1901-1940) | 8 | 5 | 11 | 8 | 9 | 10 | 101 |
| 期待値(1901–1940) | 6.97 | 7.43 | 8.00 | 8.27 | 8.59 | 7.34 | 101.00 | カイ2乗値 = 14.16、p = 0.224 |
1901–1940 年生まれの日本(全競技)の生まれ月ごとのメダリスト数、日本国民の1901–1940 年の生まれ月分布に基づく期待値、一様な誕生日分布に基づく期待値

| 生まれ月 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | |
|---|---|---|---|---|---|---|---|
| 日本メダリスト数 (1941–1960) | 15 | 14 | 17 | 7 | 12 | 10 | |
| 期待値(一様分布) | 12.56 | 11.45 | 12.56 | 12.16 | 12.56 | 12.16 | |
| 生まれ月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | Total |
| 日本メダリスト数 (1941–1960) | 14 | 6 | 12 | 12 | 15 | 14 | 148 |
| 期待値(一様分布) | 12.56 | 12.56 | 12.16 | 12.56 | 12.16 | 12.56 | 148.00 | カイ2乗値 = 9.66、p = 0.561 |
| 生まれ月 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | |
|---|---|---|---|---|---|---|---|
| 日本メダリスト数 (1941–1960) | 15 | 14 | 17 | 7 | 12 | 10 | |
| 期待値(1941–1960) | 16.95 | 13.64 | 13.77 | 12.16 | 10.96 | 10.34 | |
| 生まれ月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | Total |
| 日本メダリスト数 (1941-1960) | 14 | 6 | 12 | 12 | 15 | 14 | 148 |
| 期待値(1941–1960) | 11.65 | 12.05 | 11.87 | 11.83 | 11.60 | 11.18 | 148.00 | カイ2乗値 = 8.52、p = 0.666 |
1941–1960 年生まれの日本(全競技)の生まれ月ごとのメダリスト数、日本国民の1941–1960 年の生まれ月分布に基づく期待値、一様な誕生日分布に基づく期待値

| 生まれ月 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | |
|---|---|---|---|---|---|---|---|
| 日本メダリスト数 (1961–1980) | 14 | 14 | 12 | 14 | 13 | 17 | |
| 期待値(一様分布) | 17.57 | 16.01 | 17.57 | 17.00 | 17.57 | 17.00 | |
| 生まれ月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | Total |
| 日本メダリスト数 (1961–1980) | 18 | 24 | 26 | 19 | 13 | 23 | 207 |
| 期待値(一様分布) | 17.57 | 17.57 | 17.00 | 17.57 | 17.00 | 17.57 | 207.00 | カイ2乗値 = 14.33、p = 0.215 |
| 生まれ月 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | |
|---|---|---|---|---|---|---|---|
| 日本メダリスト数 (1961–1980) | 14 | 14 | 12 | 14 | 13 | 17 | |
| 期待値(1961–1980) | 18.72 | 16.84 | 17.66 | 17.47 | 17.11 | 16.22 | |
| 生まれ月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | Total |
| 日本メダリスト数 (1961-1980) | 18 | 24 | 26 | 19 | 13 | 23 | 207 |
| 期待値(1961–1980) | 17.84 | 17.76 | 17.21 | 16.93 | 16.00 | 17.25 | 207.00 | カイ2乗値 = 14.62、p = 0.201 |
1961–1980 年生まれの日本(全競技)の生まれ月ごとのメダリスト数、日本国民の1961–1980 年の生まれ月分布に基づく期待値、一様な誕生日分布に基づく期待値

- Newer: うお座効果は本当に存在するのか (7)
- Older: うお座効果は本当に存在するのか (5)
Comments:0
Trackbacks:0
- Trackback URL for this entry
- http://www.hoshitani.com/festinalente/2008/09/07/is-pisces-effect-real-6/trackback/
- Listed below are links to weblogs that reference
- うお座効果は本当に存在するのか (6) from Festina lente



