← 返回赛程

Model Credibility

模型可信度

我们公开模型预测的对错——这不是 AI 推单,而是把模型放到历史数据上检验。下面用 Brier Score概率预测的准确度分数(0~2),越低越准;完全瞎猜≈0.667。 胜负方向命中率预测概率最高的那个结果(胜/平/负)实际发生的比例;随机≈1/3。,对照「瞎猜」与模型自身的弱化基线;并主动展示预测失误的案例。

回测准确度

基于 1,315 场 2025 年至今的国际比赛(回测样本不参与训练,无泄漏用模型没见过的历史比赛检验预测,这些比赛不参与训练 —— 避免'自己考自己'。)。

本模型(Dixon-Coles 加权 MLE)
0.4839 · 命中 61%
均值比基线
0.5624 · 命中 55%
瞎猜(均匀 1/3)
0.6667

Brier 越低越好;瞎猜(均匀 1/3)= 0.667 是地板。模型显著优于瞎猜即说明有参考价值。

校准曲线

模型说「60%」的那些预测,实际是否约六成发生?点越贴近对角线,概率越校准若模型说'60%'的事约六成真的发生,就是'校准良好'。

预测概率 →实际频率 →

预测失误案例

模型最自信却预测错的几场(按客观规则选取,不挑选)——诚实展示局限,而非只挑「说中」的。

  • ?Turks and Caicos Islands
    vs
    ?Marshall Islands
    2025-08-16
    模型偏向 客胜(主 0% / 平 0% / 客 99%)· 实际 主胜 3-2
  • ?Marshall Islands
    vs
    ?United States Virgin Islands
    2025-08-14
    模型偏向 主胜(主 98% / 平 2% / 客 0%)· 实际 客胜 0-4
  • ?Saint Vincent and the Grenadines
    vs
    ?British Virgin Islands
    2025-05-30
    模型偏向 主胜(主 94% / 平 5% / 客 1%)· 实际 平局 1-1
  • 西班牙
    vs
    伊拉克
    2026-06-04
    模型偏向 主胜(主 93% / 平 6% / 客 1%)· 实际 平局 1-1
  • ?Saint Vincent and the Grenadines
    vs
    ?Jamaica
    2025-03-21
    模型偏向 客胜(主 4% / 平 8% / 客 89%)· 实际 平局 1-1

世界杯「活的」可信度

样本累积中——世界杯比赛结束后,这里会逐场累积模型对当晚比赛的预测准确度。

0

场已结束 · 样本累积中