うお座効果は本当に存在するのか (7)
Posted by Kensuke Hoshitani on 14 Sep 2008 at 11:55 pm | Tagged as: 統計
うお座効果に関するこれまでのエントリーは以下の通りです。
- うお座効果は本当に存在するのか (1)
- うお座効果は本当に存在するのか (2)
- うお座効果は本当に存在するのか (3)
- うお座効果は本当に存在するのか (4)
- うお座効果は本当に存在するのか (5)
- うお座効果は本当に存在するのか (6)
今回のエントリーでは、水泳・水球のメダリストについてみていきます。ケネス・ミッチェル氏は、自身のサイトであるThe Pisces Effectで、これまでオリンピックのメダリストの生まれ星座を調べた結果、うお座生まれの選手は、水泳や水球といった種目でのメダルがそれ以外の選手に比べて多いと主張し、これをうお座効果(Pisces Effect)と名付けています。
ミッチェル氏が特に取り上げているのは水泳・水球のメダリストの生まれ星座分布であるので、最初から水泳・水球だけについて自分の分析を書いてもよかったのですが、ミッチェル氏は、メダリスト全体の生まれ星座分布に関しても、統計的に有意な偏りが存在することを主張しているので、その主張の妥当性を検証するために、全競技のメダリストの分布について、ここまで随分と長く書いてしまいました。ここまで書いてきたことで、ミッチェル氏が示しているような単純な議論では、メダリストの生まれ月/生まれ星座の分布の偏りについて、意味のある主張を行うことができないことはお分かりいいただけたと思います。
さて、水泳・水球のメダリストについてです。ミッチェル氏は、うお座効果の証拠として、水泳や水球のメダリストの生まれ星座分布を、一様な誕生日分布に基づく期待値と比較することによって、うお座生まれが統計的に有意に多いと主張しています。また、ミッチェル氏は、水と関係が深い競技として、水泳、水球、ボート、セーリング、カヌーを取り上げ、それらを除いた競技の生まれ星座分布を、一様な誕生日分布に基づく期待値と比較することによって、水と関係のない競技ではメダリストにうお座は多くないとも主張しています。
しかし、水泳、水球のメダリストが他の競技よりもうお座が多いと主張したいのであれば、一様な誕生日分布に基づく期待値と比較するのではなく、全競技のメダリストの生まれ月/生まれ星座の分布と比較したカイ2乗適合度検定の結果を示すべきです。ミッチェル氏は、そういった妥当な統計検定の結果を示していません。
もちろん、これまでみてきたように、メダリストの生まれ月/生まれ星座の分布は国によっても年代によっても変わるので、水泳や水球のメダリストの生まれ月/生まれ星座分布を、全競技のメダリストの生まれ月/生まれ星座の分布と比較すれば事足りるとは言えませんが、少なくとも全競技のメダリストの生まれ月/生まれ星座に対して、カイ2乗適合度検定の結果を示すことは最低限必要なことです。
まず最初に、水泳メダリストの生まれ月分布と、全競技のメダリストの生まれ月分布に基づく期待値について、表とグラフを以下に示します。それに続いて、生まれ星座分布についても同様のものを示します。表の中で、カイ2乗値とp値は、カイ2乗適合度検定を適用した結果です。
| 生まれ月 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | |
|---|---|---|---|---|---|---|---|
| 水泳メダリスト数 | 101 | 109 | 116 | 87 | 115 | 98 | |
| 期待値(全競技) | 109.45 | 100.57 | 105.70 | 95.28 | 98.70 | 92.45 | |
| 生まれ月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | Total |
| 水泳メダリスト数 | 95 | 106 | 81 | 86 | 93 | 68 | 1155 |
| 期待値(全競技) | 95.44 | 87.75 | 94.54 | 92.67 | 90.53 | 91.92 | 1155.00 | カイ2乗値 = 18.61、p = 0.0685 |

| 生まれ星座 | ARI | TAU | GEM | CAN | LEO | VIR | |
|---|---|---|---|---|---|---|---|
| 水泳メダリスト数 | 102 | 106 | 100 | 101 | 100 | 84 | |
| 期待値(全競技) | 105.70 | 95.28 | 95.87 | 96.30 | 93.15 | 91.28 | |
| 生まれ星座 | LIB | SCO | SAG | CAP | AQU | PIS | Total |
| 水泳メダリスト数 | 89 | 81 | 86 | 85 | 94 | 127 | 1155 |
| 期待値(全競技) | 92.18 | 88.02 | 90.63 | 97.85 | 106.13 | 102.60 | 1155.00 | カイ2乗値 = 12.61、p = 0.3196 |

グラフをみると、やはり水泳メダリストはうお座が多いという印象をもたれるかもしれません。しかし、表に示したカイ2乗適合度検定の結果から分かるように、有意水準5%でみると、水泳メダリストの生まれ月分布、生まれ星座分布のいずれもが、全競技のメダリストの分布に基づく期待値に対して、統計的に有意な偏りはもっていません。水泳のメダリストはうお座生まれが多いもなにも、水泳メダリストの生まれ月/生まれ星座分布は、全競技の生まれ月/生まれ星座分布に対して、統計的に意味のある偏りをもっているわけではないという結果が得られたわけです。ミッチェル氏の言うような「うお座効果」が存在するとはとても言えません。
ミッチェル氏は、うお座(Pisces)はラテン語で魚を意味し、水と関係の深い競技ではうお座生まれが多くなるのではないかと言っていますが、水と関係の深い競技の代表格である水泳においてうお座効果は存在しないという結果が最初に得られていれば、うお座効果という命名さえ思いつかなかったかもしれません。ミッチェル氏は、まず最初に、このデータを示すべきだったのです。
次に、水球について、同様のデータを示します。
| 生まれ月 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | |
|---|---|---|---|---|---|---|---|
| 水球メダリスト数 | 56 | 55 | 54 | 50 | 49 | 51 | |
| 期待値(全競技) | 52.21 | 47.98 | 50.43 | 45.46 | 47.09 | 44.10 | |
| 生まれ月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | Total |
| 水球メダリスト数 | 48 | 43 | 36 | 44 | 25 | 40 | 551 |
| 期待値(全競技) | 45.53 | 41.86 | 45.10 | 44.21 | 43.19 | 43.85 | 551.00 | カイ2乗値 = 13.16、p = 0.283 |

| 生まれ星座 | ARI | TAU | GEM | CAN | LEO | VIR | |
|---|---|---|---|---|---|---|---|
| 水球メダリスト数 | 48 | 44 | 59 | 51 | 41 | 41 | |
| 期待値(全競技) | 50.43 | 45.46 | 45.74 | 45.94 | 44.44 | 43.54 | |
| 生まれ星座 | LIB | SCO | SAG | CAP | AQU | PIS | Total |
| 水球メダリスト数 | 42 | 29 | 35 | 42 | 53 | 66 | 551 |
| 期待値(全競技) | 43.98 | 41.99 | 43.24 | 46.68 | 50.63 | 48.95 | 551.00 | カイ2乗値 = 17.18、p = 0.103 |

上の表から分かるように、有意水準5%でみると、水球のメダリストも、水泳のメダリスト同様に、その生まれ月分布、生まれ星座分布のいずれもが、全競技のメダリストの分布に対して、統計的に有意な偏りをもっていません。
このように、水泳単独、水球単独の分布は有意な偏りをもっておらず、うお座効果の存在は、オリンピックメダリストの誕生日のデータでは実証されないことが分かります。
さて、最後に、水泳、水球のいずれかでメダルをとった競技者(水泳・水球のメダリスト)の分布を示します。これはやや面白い結果になります。
| 生まれ月 | 1月 | 2月 | 3月 | 4月 | 5月 | 6月 | |
|---|---|---|---|---|---|---|---|
| 水泳・水球メダリスト数 | 157 | 163 | 168 | 136 | 163 | 146 | |
| 期待値(全競技) | 160.24 | 147.25 | 154.76 | 139.50 | 144.51 | 135.36 | |
| 生まれ月 | 7月 | 8月 | 9月 | 10月 | 11月 | 12月 | Total |
| 水泳・水球メダリスト数 | 143 | 148 | 116 | 129 | 114 | 108 | 1691 |
| 期待値(全競技) | 139.74 | 128.47 | 138.41 | 135.67 | 132.54 | 134.57 | 1691.00 | カイ2乗値 = 21.01、p = 0.0333 |

| 生まれ星座 | ARI | TAU | GEM | CAN | LEO | VIR | |
|---|---|---|---|---|---|---|---|
| 水泳・水球メダリスト数 | 149 | 149 | 155 | 152 | 140 | 124 | |
| 期待値(全競技) | 154.76 | 139.50 | 140.36 | 140.99 | 136.37 | 133.63 | |
| 生まれ星座 | LIB | SCO | SAG | CAP | AQU | PIS | Total |
| 水泳・水球メダリスト数 | 130 | 107 | 120 | 127 | 146 | 192 | 1691 |
| 期待値(全競技) | 134.96 | 128.86 | 132.69 | 143.26 | 155.38 | 150.22 | 1691.00 | カイ2乗値 = 23.18、p = 0.0167 |

上の表から分かるように、有意水準5%でみると、水泳・水球のメダリストの生まれ月分布、生まれ星座分布のいずれもが、全競技のメダリストの分布に対して、統計的に有意な偏りをもっています。
繰り返しになりますが、水泳、水球単独では、生まれ月/生まれ星座分布に有意な偏りはありませんでした。水泳と水球を合わせると、生まれ月/生まれ星座分布に有意な偏りが見出されるからといって、水泳、水球単独の分布にはそのような有意な偏りが見い出されない以上、ミッチェル氏の主張するような「うお座効果」が存在するとは言えないという結論に変わりはありません。
とはいえ、水泳と水球のメダリストを合わせると、なぜ有意な偏りが生じるようにみえるのでしょうか。
「うお座効果は本当に存在するのか(4)」でみたように、メダリストの生まれ月/生まれ星座分布は国によって随分変わります。
水泳と水球は、ともに水に関係の深い競技であるといっても、メダリストの出身国には違いがあり、生まれ月/星座の分布の偏りにも違いがあることが予想されます。そのため、2つの競技の生まれ月/星座分布を重ね合わせると、2つの競技の分布がもつ傾向の異なる偏りが合成され、見かけ上、重ね合わせた分布の偏りが増大する可能性があります。
実際、誕生日が判明しているメダリストの中で、水泳と水球のメダリストの出身国を比べてみると、水泳メダリストの出身国上位5位は、アメリカ 332名、オーストラリア 116名、東ドイツ 71名、ソ連 67名、ドイツ 63名であり、水球メダリストの出身国上位5カ国は、ハンガリー 81名、イタリア 73名、米国 72名、ソ連 61名、ユーゴスラビア 57名となります。アメリカ、ソ連といった共通部分もありますが、水球では、ハンガリーやイタリアといった水泳では上位五位に入らなかった特徴的な国の影響が目立ちます。
このことを念頭に、まず、生まれ月分布についてみてみましょう。生まれ月分布に関して、水泳単独の分布の偏りと、水泳・水球の分布の偏りを比べて、どの生まれ月の偏りが増えたかをみてみると、9月生まれと11月生まれの偏りが増えていることが分かります。特に、11月生まれは、水泳単独の分布では、期待値(全競技の分布から計算した期待値)とほぼ同じメダリスト数であるにもかかわらず、水泳・水球の分布では、期待値よりもメダリスト数がかなり少なくなっていることが分かります。これは、水球では、11月生まれが期待値よりも少ないという、水泳にはない特徴をもっているためです。水泳と水球の分布と重ね合わせることにより、もともと水泳にはなかった偏りが積み重なり、結果として、全体の分布の偏りが増大したように見えるのです。
次に、生まれ星座の分布についても同様にみてみます。生まれ星座分布に関して、水泳単独の分布の偏りと、水泳・水球の分布の偏りを比べると、まず、うお座生まれの偏りが増えていることが分かります。しかし、それだけではなく、さそり座生まれの偏りも増えていることが分かります。水泳単独の分布では、さそり座生まれは期待値と大きく変わりませんが、水泳と水球を合わせると、さそり座生まれが期待値よりもかなり少なくなるのです。これも、水泳にはない水球独特の分布の特徴によるものであり、水泳と水球の分布を重ね合わせると、結果として、全体の分布の偏りが増大したように見えるのです。
このように、出身国の分布が異なる競技の分布を重ね合わせると、どういった副作用が生まれるかは予想できず、その副作用をもって、なんらかの意味のある統計現象が発見されたと言うことはできません。この場合、水泳単独、水球単独それぞれの分布には有意な偏りは見いだせなかったわけなので、うお座効果の存在は実証できないというのが、尤もな結論となります。
ここで終わってもよいのですが、水泳と水球の分布について、もう少しみていきたいと思います。