R for Horse Racing 中的 Mlogit 预测为测试数据获利,但对训练数据效果不佳

Mlogit predictions in R for Horse Racing making profit for test data but does not preform well for Train Data

提问人:frenchie257 提问时间:11/1/2023 更新时间:11/1/2023 访问量:19

问:

第一次问,所以如果我能澄清任何事情,请告诉我。

我试图预测赛马的获胜概率。我正在使用 mlogit 包来做到这一点。我目前的测试方法是我有 ~50 个工程功能。我随机选择 5 个并训练模型。然后,我将获胜概率与所有马匹的市场赔率进行比较。如果赔率高于我的模型预测的赔率,我会使用凯利准则对那匹马下注。对于某些 5 个特征,我可以根据测试数据获得 ~15% 的利润(50/50 拆分),但随后我在用于训练 mlogit 模型的训练数据上运行模型,它给出了 -20% 的利润。

这是意料之中的吗?为什么它在测试数据上表现良好,但在训练数据上却表现不佳?

干杯

y<-mlogit.data(dsTest,shape="long", id.var="Raceno")
x<-mlogit.data(dsTrain_after,choice="Wincol",shape="long", id.var="Raceno")
mymod <- (mlogit(Wincol ~ Start_Price_Standardized + Top3_All_From_3_Races_Standardized + 
                   Number_Standardized + length_model_no_price_pred + length_model_price_pred + 
                   place_model_price_pred - 1, data=x))
R 模型 mlogit

评论

0赞 Nir Graham 11/1/2023
我认为这只能表明你的模型的作用与你评估其成功的方式之间存在错位。您的模型预测了赢得比赛的几率,而您还没有与我们分享它在训练/测试中的表现。你的模型不是为了让你盈利而开发的,但你表明,以你的方式使用它会导致利润领域的表现不佳或至少不稳定。

答: 暂无答案