Model Credibility

模型可信度

我们公开模型预测的对错——这不是 AI 推单,而是把模型放到历史数据上检验。下面用 Brier Score概率预测的准确度分数(0~2),越低越准;完全瞎猜≈0.667。和胜负方向命中率预测概率最高的那个结果(胜/平/负)实际发生的比例;随机≈1/3。,对照「瞎猜」与模型自身的弱化基线;并主动展示预测失误的案例。

回测准确度

基于 1,315 场 2025 年至今的国际比赛(回测样本不参与训练,无泄漏用模型没见过的历史比赛检验预测,这些比赛不参与训练 —— 避免'自己考自己'。)。

本模型(Dixon-Coles 加权 MLE)

0.4839 · 命中 61%

均值比基线

0.5624 · 命中 55%

瞎猜(均匀 1/3)

0.6667

Brier 越低越好;瞎猜(均匀 1/3)= 0.667 是地板。模型显著优于瞎猜即说明有参考价值。

校准曲线

模型说「60%」的那些预测,实际是否约六成发生?点越贴近对角线,概率越校准若模型说'60%'的事约六成真的发生,就是'校准良好'。。

预测失误案例

模型最自信却预测错的几场(按客观规则选取,不挑选)——诚实展示局限,而非只挑「说中」的。

?Turks and Caicos Islands
vs
?Marshall Islands
2025-08-16
模型偏向客胜(主 0% / 平 0% / 客 99%)· 实际主胜 3-2
?Marshall Islands
vs
?United States Virgin Islands
2025-08-14
模型偏向主胜(主 98% / 平 2% / 客 0%)· 实际客胜 0-4
?Saint Vincent and the Grenadines
vs
?British Virgin Islands
2025-05-30
模型偏向主胜(主 94% / 平 5% / 客 1%)· 实际平局 1-1
西班牙
vs
伊拉克
2026-06-04
模型偏向主胜(主 93% / 平 6% / 客 1%)· 实际平局 1-1
?Saint Vincent and the Grenadines
vs
?Jamaica
2025-03-21
模型偏向客胜(主 4% / 平 8% / 客 89%)· 实际平局 1-1

世界杯「活的」可信度

样本累积中——世界杯比赛结束后,这里会逐场累积模型对当晚比赛的预测准确度。

场已结束 · 样本累积中