えっと、かなりの間こちらのブログをほったらかしにしておりましたが、心機一転して競馬のデータ分析を行っていこうかなと考えております。(メインのブログの方がネタ切れっていうのもあるんですけど・・・)
まあ、最近某ソシャゲの影響で競馬ファンが増えた事もありまして、競馬のデータ分析に需要があるのでは?思っている次第であります。
ちなみに私はダビスタ3から競馬に入ったクチでして・・・(というかもう30年前になるのか)
結構競馬を見てきた期間は長いです。
で、どんな分析をやっていこうかという話なのですが、今流行り(?)の機械学習での着順予想、それといろいろ仮設を立てて検証分析(本当にハイペースだと追い込みが有利なのか?など)をやっていこうかと思っています。
一応、現段階でJRA-VANのデータを用い、機械学習予想モデルは作っています。
このお手製予想モデルにて、1着予想した馬が実際に1着になる確率は26.16%ほど
これをしょぼいと見るかどうかは意見が分かれると思いますが、一番有名な競馬予想ソフトの1着予想の的中率が28%くらいらしいので、そこそこいい線行っているのではないでしょうか。
※機械学習モデルそのものの説明、公開についてはきちんと内容整理できてから考えます。
しかしながら、この予想モデルはまだまだ改善の余地がありますし、この予想結果通りに馬券を購入したとしても回収率が上がるとは限らないんですよね。
なかなかに利益をあげるのは難しいです。
というわけで、そんな機械学習予想モデルと、様々な角度(競馬場、種牡馬、脚質、馬場状態など)から分析したデータを組み合わせて、なんとか回収率を100%以上にできないものかと研究してみます。
そんなこんなで、いろいろな分析をやりながら、広告で儲けたいpythonによるデータ分析のスキルを磨くのが当サイトの目的になるかなと思います。
・・・三日坊主にならないようにがんばります(汗)
あ、それから当サイトのデータ、情報を元に馬券を買って、損失が出たとしても当サイトは責任を負いかねますのでご了承ください。
あくまで自己責任にてお願い致します。
※画像はぱくたそさんから頂いています。