「AIは楽をしたがる」競馬予想AI開発の落とし穴。競馬新聞の印を学習させた結果、収支が崩壊した理由

今週の競馬激闘譜

横けんです!

先週の収支ですが

4月4日(土)は199,200円のマイナス
4月5日(日)は372,000円のマイナスということで

1週間で571,200円のマイナスということになってしまいました。

いやー、AIを導入してから順調だったのですが、先週は一気に崩れてしまいました。。

ちょっと理由があってこういうことになってしまったのはありますので、それを説明していこうと思いますが、まずは、恒例の自信度4以上の成績を見ていきましょう。

本当に今までとは打って変わって、全くダメで終わってしまいました。今までは本命と対抗が回収率100%超えあたりで来ていたんですが、一気に先週は負けてしまっております。

自信度1以上の全ての予想も見ておきましょう。こちらです。

いやー、本当に今までと大激変してしまいました。なんでこういうことが起こってしまったのかという分析は終了しておりますので、これを包み隠さずお話しします。

ぶっちゃけあんまりAIの中身のことは言いすぎないようにしていたのですが、今回は具体性のある話で説明したいので、何が起こったのかという話をしたいと思います。

【とりあえず大荒れの難しい週だったことはあります】

まず、先週ですが、これは本当の言いたいことではないのですが、雨と風の影響で土曜は特にですが大波乱で非常に難しかったのは確かですね。

単勝万馬券の馬が多数馬券に絡み、予想することがとても難しかったですね。

また、私の本命にした馬は故障したり、1着と差がない4着に負けたりなどもあり、運もなかったですね。

非常に難しい週だったということはありますね。

【AIの調整をしくじりました】

これだけ冴えない結果となってしまったのは、この週に行った私の改善が悪い方向にいってしまったということがあります。

これはAIをやっている方は結構参考になると思いますね。

何の改善をしたのかということを、もう私はこの手は絶対に使わないので、具体的に言います。

何をしたのかというと、某競馬新聞の記者さん達の予想の印を私のデータに取り込んで、予測材料にするということをやりました。

なかなかいい考えだなとは思っていたんですよ!競馬新聞の記者の人はトレセンに出向いて馬を直接見ている訳ですしね!

正直、あんまり深く考えていなかったんですよ。私がAIに食わせているデータというのは、今は3000種類以上あるんですよ。

でも、まだまだ色々な予想ファクターを混ぜ込めばより良いAIができあがるとおもっていたんですね。

それで、AIに予想させたら、どの予想ファクターが効いたかをランキングで出してくれるんですね。

どの予想ファクターを最重視しているのかを客観的に見ることができるわけです。

最初は、まー、トップ10くらいに入ってくれれば、今の弱点を補える予想になるのかなということであんまり深く考えずにAIに分析させてたんですね。

競馬記者の方の印が5人から6人くらいあって、それを5年分、全部データにため込んで、AIに渡した訳です。

どうなったと思いますか?

「競馬新聞の予想系のデータが1~5位まで独占になった」んですよ。

結構ビックリしましたね。

え!競馬新聞の予想ってすご!って思った訳です。

ただ、すごすぎて、AIは競馬新聞の予想印の予想をほとんど参考にするようになったので、これだとさすがにまずいだろうということで、上位独占だった予想ファクターを1つだけにして、渡すことにしたんですね。

これが行った改善だった訳です。

【それでも競馬新聞の予想ファクターは圧倒的すぎた】

1つだけのデータだけ渡して、あとは今まで通りの予想ファクターで戦った先週だった訳ですが、1つだけにしようと思った時はランキングは1位だったけど、他の予想材料ともそこまで大差はなかったのですが。。

直前でAIに学習させたところ、競馬新聞の予想ファクターは圧倒的な1位となっていました。

ぶっちぎりで強力な予想ファクターとなった訳です。

さて、これの何がいけなかったのか?ということになりますよね。

だって、AIは競馬新聞の予想が一番優れていると判断した訳ですから!

任せておけばいいじゃん!となりますよね。私もそう思っていたんですよ。

【AIは楽をしたがる性質がある】

私のAIには3000以上もの予想ファクターが存在していると言いました。

色々なジャンルの予想ファクターが入っているんですよ。

でも、AIって楽をしようとするんですよ。

AI的な目線で言うと、競馬新聞の予想ファクターがデータとして入ってきた時に

「え!君、なんかすごそうじゃん!なんかいい感じだから、君に色々任せちゃいますわ!」

ということになって、競馬新聞の予想ありきで、予想がされるようになったんですね。

はっきりいえば、競馬新聞の予想というのは、言葉が悪いですが、言ってしまうと敵なんですよ。

競馬新聞の予想がオッズを作り出していると言ってもいいんですよね。

もちろん、精度が高いんですよ。ただ、オッズを作り出しているので、妙味はないですね。

競馬新聞の予想が第一優先になってしまうと、オッズを追っていくことになるので、これだと旨味がないということになるんですね。

それで、もっと問題なのは、AIが競馬新聞の予想を第一に考えるようになったので、競馬新聞の予想がこけてしまったら、もうそれで私のAIは終わってしまうAIが出来上がってしまった訳です。

今までは、それぞれの予想ファクターが協力して出来上がってた予想だったんですね。

だから、どれかがこけても、他の予想もあるから、大きな崩れはなかったんですよ。

それが、競馬新聞の予想ファクターは強すぎるばっかりに、それがこけたら、もう予想がこけてしまうというAIとなってしまったわけです。

野球で例えるなら、私の予想ファクターは1軍も2軍も実力者揃いのバッターがいるのに、超大物に見えた1人の打者に

「君、すごいね、うちの野球部の運命は君に託すよ」と言って、そのバッターが大ごけしてしまって、全員野球じゃないチームになってしまった、といったようなことが私のAIで起こってしまった訳ですね。

【強力すぎる予想ファクターについて考える】

ちょっとこの説明でも意味がわからないかもしれないので、もう少し言うと、私の予想ファクターには、例えば、当日の風向き、当日の風速、当日の馬場の含水率、当日の馬場のクッション値、といったような予想ファクターが入っていたとします。

そして、そこに競馬新聞の予想ファクターが入ってきました。

当日の風向きのデータとか、すべてそろっていたら非常に貴重な情報ですね?

当日のクッション値、めちゃめちゃ重要な情報なはずです。

でも、競馬新聞の予想のファクターがドーンと入っちゃうと、AIは

「なんかこいつを追っかけておいた方がよさそうだぞ?」と言って、どんどん競馬新聞の予想を追いかけるようになってしまうという性質があるのですよ!

もちろん、全く無視はしないですけどね!

それでも、多くは競馬新聞頼みになっていくんですね。

でも、競馬新聞はオッズ自体を作ってしまうくらいの影響力があるものだから、それを追いかけて言っても、当たる確率はあがるかもしれないけど、そんなに儲かるかは別ですね?

当日の風速とか当日のクッション値はそれだけではもうからないかもしれないけど、色々AIが学習していったら、とんでもないダイヤモンドになる可能性もある予想ファクターなわけです。

【強すぎるファクターがあるならそれを見ていれば良い】

ということで、競馬新聞の予想ファクターは的中率がクッション値や風速などのデータより、全然的中率が高すぎるので、AIはそっちをエースとしてみなしてしまった訳ですね。

ただ、それだと意味がないですね、競馬新聞を見て判断していけばいい訳ですからね、わざわざAIを使わなくても。。

そして、1本柱のエースの予想がこけてしまったら。。?

私もなんとなくは、そういうことはわかっていたんですよ。

ただ、競馬新聞の印を6人の記者がいたとしたら、その印に重みの点数をつけて、それ特徴量にするというのが、そんなにも効いてしまうということがちょっと私の想像を超えてたんですよね。。

1本柱の予想になりすぎた、そして、そのファクターがこけてしまった。

これが失敗した原因です。

ということで、当然、競馬新聞のファクターは外しております。

3000も予想ファクターがあるので、外れても当然、他の予想ファクターが支えあうので予想の精度はびくともしておりません。

ちなみに今回の件で、指数というものも全部、予想ファクターから外しました。

指数もどうしても強い予想ファクターなんで、AIはそっちに頼っちゃうんですよ。

でも、指数のようなまとまったものも、AIが楽をしすぎるので、外して、その指数を形成している生のデータだけを残すことになりました。

要するに、クッション値とか風速とかそういう地味だけで効くみたいなものだけを3000個寄せ集めております。

ということで、私のAIにはこれで無事ににスター選手がいなくなりました。

抜けた存在はないので、3000という予想ファクターがいい感じでバランス良く支えあう予想になりました。

AIが3000の予想を使って、血眼になって当たるにはどうしたらいいかを探すようになり、元に戻りました。

これが過学習を防いで、安定的な良い予想をする上で非常に重要なことなんですね。

まー、失敗もある訳ですが、1週間でこれに気づいて、すぐに修正したので、よしとしなければなりません。

改善後の予想で、日曜の予想をやってみましたが、このような悪い回収率の予想にはなっていません。今週からはまた良い予想ができるように頑張りたいと思います。


コメント

タイトルとURLをコピーしました