よく競馬新聞や、予想サイトなんかで
「◯◯は危険な1番人気」
「危険な1番人気を自身を持って切ることができれば回収率をアップできる」
などというコメントを目にすることがあるのですが、危険な1番人気を見極めることなんてできるんでしょうか?
できればそりゃ素晴らしいなと思うんですけど・・・我が機械学習モデルでそれが可能なのかどうかちょっと調べてみました。
分析の概要、条件
まず分析の概要ですが、
概要
機械学習モデルが吐き出す予想指数が比較的低い1番人気馬の1着率、単勝回収率を調査
これでいってみます。
予想順位が低い馬・・・と最初考えたのですが、これだと予想指数的には僅差なのに、順位的には下の方になってしまった1番人気馬も対象となってしまい、それはちょっと違うよなぁと思って指数にしました。
ただ、この指数。出走馬のレベルや、出走頭数によっても上下するので、ある一定の値をしきい値にして分類するのもあまりよろしくないと思われる。
ですので、この予想指数をレースごとに正規化してしきい値を設定する・・・という事にしました。
正規化とは・・・
ある数値群の最低値を0、最高値を1としてその間のデータをスケーリングして並べるというものです。
これならば、その1番人気の馬が、そのレースの出走メンバーの中で相対的にどの位置に評価されているのかが分かります。
出走メンバーのレベルや、出走頭数も関係なくなり、ただ単に出走メンバー中の相対的な評価が分かるわけですね。
分析条件
- 機械学習モデルにおいて低い評価をされた一番人気馬の1着率、回収率を分析
- 1番人気馬の評価指標には、予想指数を正規化したものを使う
- 2019~2022年2月までの中央競馬のレース(障害、新馬戦除く)
以上の条件で分析を行いました。で、その結果がこれ
分析結果
この表の見方ですが、左の「正規化予想指数」のところで、「<=0.5」となっている行は、予想指数を正規化した値が0.5以下となった一番人気馬を対象とした分析・・・という事になります。
しかし、まあ・・・ビミョーですねぇ。
低評価になればなるほど1着率が低くなる傾向は見られるものの、回収率はさほど変わらず。
標準化した指数が0.2以下なら自身を持って『切れる』かもしれませんが、対象レース少なすぎですね。3年間でたった15レースというのはちょっと(^_^;)
こちらの表は正規化した予想指数を階級別に分析した結果です。
0.8~0.9 だと、予想指数が0.8~0.9の間にある1番人気馬が対象・・・という事になります。
こうして見ると、あまり差がないですね。
結論
結論としては
『危険な1番人気馬を見極めるのはやっぱ難しい』
でした! (ミモフタモナイ)
全然参考にならなくてすんません・・・
でも、よくよく考えれば、危険な人気馬が簡単に分かるのなら、その馬は最初っから1番人気にはなってないですよね(´・ω・`)
1番人気の馬はそれなりの理由があって1番人気になっているワケであって、それを軽視することはできない。
いま巷にあるAIとか機械学習の予想も、1番人気の勝率は勝てないですし、
それを再確認できただけでも良かった・・・のかな?