初心者ガイド > ボート予想を始める前に知っておきたい統計の話
ボート予想を始める前に知っておきたい
統計の話
読み終わるまで: だいたい10分
この記事のまとめ
- 予想サイトの「100回中60回当たる」は、 サンプル数 を確認しないと判断できない
- 本当の数字には ブレ幅 がある。1点だけ見ずに「だいたい何円〜何円」を意識すると失敗が減る
- AIの実力は、 勉強に使っていない問題 で測らないと信じる意味がない
- 難しい数式は要らない。サイコロと試験勉強の例えで全部説明できる
統計と聞いて身構えなくていい
「統計」と言うと、難しい数式やグラフを思い浮かべて頭が痛くなる方も多いと思う。 でも、予想サイトの数字を見て損しないために知っておきたい話は、 たった3つ だけで御座る。
全部、サイコロや試験勉強といった 身近な例え で説明できる。 数式は1つも出てこない。10分で読み終わる。
この3つを知っておくだけで、世の中の予想サイトを見る目が変わる。 「あ、このサイトは数字を盛っているな」と気づけるようになる、というのが本記事のゴールで御座る。
話 1: サンプル数 — 「3回中3回当たる」と「100回中60回当たる」、どっちが信用できるか
ある予想サイトAが「直近3レース、3戦3勝、的中率100%」と書いていたとする。 別の予想サイトBは「直近100レース、60勝、的中率60%」と書いていたとする。
数字だけ見ると A の方が圧倒的に上に見える。100% vs 60%、勝負にもならない。 でも、AI業界やデータ分析の現場では、 B の方を信用する 。 理由は サンプル数 (試行回数) の違いで御座る。
サイコロで考えてみる
普通のサイコロを 3 回振って、たまたま 3 回連続で 6 が出ることは、決して珍しくない。 確率を計算すると、約 0.46% (1/216) で起きる。100人がやれば 1〜2人は経験する。
じゃあ、3回連続で 6 が出た人が「自分の振り方には特殊な才能がある、6 を出せる」と主張したら、信じるだろうか。 普通の人なら「いや、たまたまでしょ」と思うはず。
サイコロを 100 回振って、もし 60 回 6 が出たら、これは たまたま ではあり得ない。 特殊な才能か、不正なサイコロを使っているか、どちらかで御座る。
つまり 「試行回数が増えると、たまたまでは説明できなくなる」 。 これが統計の基本中の基本で御座る。
予想サイトに当てはめると
予想サイトの「直近の数字」を見るときも同じこと。
- サンプル数 30 件未満: ほぼ参考にならない。たまたま当たっているか外れているかの差が大きい
- サンプル数 100 件以上: ようやく実力の輪郭が見えてくる
- サンプル数 1000 件以上: ほぼ実力。たまたま では済まされない
当サイトの 過去30日成績ページ でも、サンプル数を併記している。 サンプル数 30 件未満は「実績集計中」と表示して、数字を出さないようにしている。 数字が独り歩きするのを防ぐためで御座る。
話 2: 信頼区間 — 「100円→105円」だけでは半分の情報
予想サイトに「回収率 105%」と書いてあったら、何を思うだろうか。 「100円賭けたら平均 105円戻ってくるんだな、儲かるじゃないか」と思うかもしれない。
でも、ここに もう一つの落とし穴 がある。 「平均」の数字には ブレ幅 があって、ブレ幅を見ないと正確に判断できないのだ。
天気予報で考えてみる
明日の最高気温の予報が「20℃」とだけ書かれていたら、何を着るか迷う。 実は気象予報の現場では、内部で「だいたい 18℃〜22℃」のような幅を持った予想を出している。 これを 「予測区間」「信頼区間」 と呼ぶ。
「20℃」だけだと「もし 25℃ になったら半袖で良かったのに失敗した」となる。 「18〜22℃」と幅で言われると、長袖を選ぶ判断ができる。幅を見ることで、判断の質が上がる 。これが信頼区間の役目で御座る。
回収率にも信頼区間がある
回収率も同じこと。「100円→105円」と書いてあっても、本当の実力は「100円→だいたい 95円〜115円」 という幅を持っているのが普通で御座る。
幅の下が 100円を切っている (= 95円〜115円なら、95円は損する範囲) 場合、 実際には損する可能性が結構残っている、という意味になる。 逆に幅の下が 100円を超えている (= 102円〜108円のような場合) なら、損する確率は低い。
Bootstrap CI という計算方法
この幅を計算する方法の一つに 「Bootstrap 法」 というやり方がある。 名前は難しそうだが、やっていることは単純で御座る。
手元にある成績データから、ランダムにレースを抜き出して再集計するのを 1000 回繰り返す。 1000 回分の回収率を並べて、その上下の範囲を見る。これだけ。
サイコロをイメージしてもらいたい。 「1万回振った結果」を一度しか見られない状況で、 手元の結果から「もし別の1万回振ってたら、どれくらい違う数字が出ただろう?」を再現するイメージで御座る。
当サイトでは、この Bootstrap CI を使って 「だいたいのブレ幅」 を表示している。 点 1 つで儲かる気にならず、幅を見て冷静に判断してもらうためで御座る。
話 3: 学習データ分離 — 「テスト前に答えを見て満点」の罠
3 つ目は、AI の実力をどう測るか、という話。 ここが 世の中の予想サイトが一番ごまかしているポイント で御座る。
試験勉強で考えてみる
来週テストがある。先生から「来週の問題はこれだよ」と問題用紙を事前に見せてもらった子供が、 翌週そのテストを受けて満点を取ったとしたら、本当の実力は分かるだろうか。
答えは「分からない」。問題を覚えただけで、似た別の問題が出たら解けないかもしれない。 実力を測るには、 勉強に使っていない問題 でテストする必要がある。 これは普通の感覚で御座る。
AI予想も全く同じ
AI予想も、ある期間のレースデータを「勉強用」として食わせて、レース結果を覚えさせる。 このとき、勉強用データと同じレースで成績を測ると、当然いい数字が出る。答えを見ながらテストを受けている ようなものだから。
実戦でも同じ数字が出るかは、 勉強に使っていない期間のレース でテストしないと分からない。 AI業界では、これを 「Hold-out (ホールドアウト)」 と呼ぶ。 直訳すると「取り置き」「取り分けておく」という意味で御座る。
Strict hold-out — 厳密に分ける
ところが、Hold-out にも 「ゆるい Hold-out」と「厳しい Hold-out」 がある。
ゆるい Hold-out: 勉強用データと評価用データを分けてはいるが、 評価用データを何度も見返してチューニングする。これだと結局、評価用データの答えを少しずつ覚えてしまう。 完全な「答えを見ない」状態にはなっていない。
厳しい Hold-out (Strict hold-out): 評価用データは 一度も見ない 。 評価用データで数字を出すのは、最終評価の 1 回だけ。それ以外は触らない。
当サイトでは、 直近 30 日のレースは Strict hold-out として完全に隔離 している。 AIモデルの調整・選定には一切使わず、結果集計のときだけ取り出して数字を出している。 この30 日分の数字が、当サイトの「本物の実力」と表示している数字で御座る。
3つの話を組み合わせると
ここまで読んでくださった方なら、予想サイトの数字を見るときに以下の 3 点をチェックする習慣がつくはず。
- サンプル数 はいくつか (30 未満は要注意、100 以上で輪郭が見えてくる)
- ブレ幅 は書いてあるか (1点だけでは不十分。幅の下が 100円を切ってないかを見る)
- 勉強に使っていない期間 で測った数字か (Strict hold-out の数字か、それとも学習データ込みの数字か)
この 3 点が公開されていない予想サイトは、まず疑ってかかった方がいい。 逆に、この 3 点を素直に書いてあるサイトは、信用できる確率が高い。
当サイトでの実装
当サイトでは、 過去30日成績ページ で 3 点全部公開している。
- サンプル数 (例: 「複勝 n=315」「3連複 n=2461」など、賭式ごとに何回賭けたかの実数)
- Bootstrap CI のブレ幅 (例: 「100円→ 110円、ブレ幅 95〜130円」)
- Strict hold-out で測った数字であることの明記
そして、サンプル数が 30 未満の賭式 (主に単勝の特定期間) では、 そもそも数字を出さない ようにしている。 試行回数が少ないと、たまたまの好成績・不成績に意味を持たせるのは危険だと考えるからで御座る。
最後に — 統計は嘘をつかない、人が嘘をつく
「統計は嘘をつくのに使われる」とよく言われる。 でも、嘘をつくのは統計ではなく、 統計を見せる側の人間 で御座る。
サンプル数を伏せたり、ブレ幅を出さなかったり、学習データ込みで測った数字を「本物の実績」と称したり。 これらは全部、 統計を悪用した嘘 で御座る。
逆に、サンプル数・ブレ幅・hold-out をきちんと開示すれば、嘘がつけなくなる。 これが、当サイトが 「Glass Box (透明な箱)」 と呼んでいる戦略の中身で御座る。
詳しい仕組みは 「正直予想」とは何か もご覧頂きたい。 舟券購入は 免責事項 をご確認の上、無理のない範囲で楽しんで頂きたく。