競馬をやっている人なら一度は「スピード指数」という言葉を聞いたことがありますよね。「あたる」という人もいれば、「当たらない」という人も。では、その「スピード指数」の精度、誤差ってどれくらいあるのでしょうか?精度も誤差もわからないままじゃ、うまく活用できませんよね。おそらく日本でもっとも有名なスピード指数である「西田式スピード指数」について評価してみました。
スピード指数とは?
スピード指数とは、馬の能力を数値化する目的で開発されている指数で、1975年にアンドリュー・ベイヤーによって提唱されたものが原型と言われています。日本では1992年に西田和彦氏が提唱した「西田式スピード指数」が有名ですね。西田式スピード指数では、以下のような計算式が使われています。
スピード指数 = (基準タイム – 走破タイム)× 距離指数 + 馬場指数 + (斤量 – 55)× 2 + 80
上記の式で示されているように、スピード指数は走破タイムをもとに、
- 競馬場
- コース(芝・ダート)
- 距離
- 馬場状態(良、稍重、重、不良)
- 斤量
などの影響を差し引いて、馬の能力を数値で表すアプローチと言えます。
とは言え、
- 馬の調子
- レース展開(スローペース or ハイペース)
- 枠順の有利、不利
- レースのあや(位置取り)
- レース中のハプニング(接触)
- 馬の能力の成長や衰え
などが走破タイムに影響するので、スピード指数は毎回一定の値になるわけではなくばらつきますし、スピード指数を算出するためのモデル化の精度・ばらつき(西田式の場合の「基準タイム」、「距離指数」、「馬場指数」、『斤量の影響係数( = 2)」)も影響すると考えられます。
スピード指数のばらつき(誤差、精度)
では、スピード指数はいったいどれくらいばらつくのでしょう?西田式スピード指数について評価してみます。
過去10年のデータについて、各馬ごとの平均値を計算し、各レース・各馬のスピード指数との差分を算出してみました。
Δスピード指数(スピード指数のばらつき) = 各レース・各馬のスピード指数 – 各馬の平均値
「Δスピード指数」のばらつき具合を確率密度で表現した結果が下の図です。
「Δスピード指数」は
- ばらつきの標準偏差は約15
- ばらつきは0を基準に左右対称ではなく、低い側に裾野が広い
ということがわかります。ばらつきの標準偏差が15ですか…。結構大きいですね。
ここで計算している「Δスピード指数」は各馬の能力の平均を差し引いているので、スピード指数による競馬予想という観点では、「Δスピード指数 = 0」が理想です。それが0になっていないということは、上の図は、スピード指数によるモデルでは表現できない要素( = 誤差、精度)を表していると言えます。
Δスピード指数のモデル化
スピード指数を使った予測をする上では、「Δスピード指数」を考慮する必要があります。上述の通り「Δスピード指数」はスピード指数の誤差や精度であるので、確率的なモデルでモデル化しました。今回設定した確率モデルを上の図に赤い線で示しています。かなり良くモデル化でいているように見えます。
「Δスピード指数」の分布が左右非対称であるので、Exponentially Modified Gaussian分布を適当に変数変換してモデルを設定しています。
Exponentially Modified Gaussian分布というのは、正規分布に従う確率変数をX、指数分布に従う確率変数をYとしたときに、Z = X + Yが従う確率分布です。Xが馬の能力による走破タイムのばらつき、Yが「レース展開」「位置取り」「ハプニング」等のレースのあやによるばらつきと考えると、なんとなく妥当な説明ができそうなモデル化であると思っています。
まとめ
西田式スピード指数では、標準偏差で15程度の大きさのばらつき(誤差)がありそうです。かなり大きいばらつきだと思います。逆にいうと、これはまだまだ改善の余地があるということかもしれませんね。