Model Credibility
模型可信度
我们公开模型预测的对错——这不是 AI 推单,而是把模型放到历史数据上检验。下面用 Brier Score概率预测的准确度分数(0~2),越低越准;完全瞎猜≈0.667。 和 胜负方向命中率预测概率最高的那个结果(胜/平/负)实际发生的比例;随机≈1/3。,对照「瞎猜」与模型自身的弱化基线;并主动展示预测失误的案例。
回测准确度
基于 1,315 场 2025 年至今的国际比赛(回测样本不参与训练,无泄漏用模型没见过的历史比赛检验预测,这些比赛不参与训练 —— 避免'自己考自己'。)。
本模型(Dixon-Coles 加权 MLE)
0.4839 · 命中 61%
均值比基线
0.5624 · 命中 55%
瞎猜(均匀 1/3)
0.6667
Brier 越低越好;瞎猜(均匀 1/3)= 0.667 是地板。模型显著优于瞎猜即说明有参考价值。
校准曲线
模型说「60%」的那些预测,实际是否约六成发生?点越贴近对角线,概率越校准若模型说'60%'的事约六成真的发生,就是'校准良好'。。
预测失误案例
模型最自信却预测错的几场(按客观规则选取,不挑选)——诚实展示局限,而非只挑「说中」的。
- 2025-08-16?Turks and Caicos Islandsvs?Marshall Islands模型偏向 客胜(主 0% / 平 0% / 客 99%)· 实际 主胜 3-2
- 2025-08-14?Marshall Islandsvs?United States Virgin Islands模型偏向 主胜(主 98% / 平 2% / 客 0%)· 实际 客胜 0-4
- 2025-05-30?Saint Vincent and the Grenadinesvs?British Virgin Islands模型偏向 主胜(主 94% / 平 5% / 客 1%)· 实际 平局 1-1
- 2026-06-04西班牙vs伊拉克模型偏向 主胜(主 93% / 平 6% / 客 1%)· 实际 平局 1-1
- 2025-03-21?Saint Vincent and the Grenadinesvs?Jamaica模型偏向 客胜(主 4% / 平 8% / 客 89%)· 实际 平局 1-1
世界杯「活的」可信度
样本累积中——世界杯比赛结束后,这里会逐场累积模型对当晚比赛的预测准确度。
0
场已结束 · 样本累积中