提问人:frenchie257 提问时间:11/1/2023 更新时间:11/1/2023 访问量:19
R for Horse Racing 中的 Mlogit 预测为测试数据获利,但对训练数据效果不佳
Mlogit predictions in R for Horse Racing making profit for test data but does not preform well for Train Data
问:
第一次问,所以如果我能澄清任何事情,请告诉我。
我试图预测赛马的获胜概率。我正在使用 mlogit 包来做到这一点。我目前的测试方法是我有 ~50 个工程功能。我随机选择 5 个并训练模型。然后,我将获胜概率与所有马匹的市场赔率进行比较。如果赔率高于我的模型预测的赔率,我会使用凯利准则对那匹马下注。对于某些 5 个特征,我可以根据测试数据获得 ~15% 的利润(50/50 拆分),但随后我在用于训练 mlogit 模型的训练数据上运行模型,它给出了 -20% 的利润。
这是意料之中的吗?为什么它在测试数据上表现良好,但在训练数据上却表现不佳?
干杯
y<-mlogit.data(dsTest,shape="long", id.var="Raceno")
x<-mlogit.data(dsTrain_after,choice="Wincol",shape="long", id.var="Raceno")
mymod <- (mlogit(Wincol ~ Start_Price_Standardized + Top3_All_From_3_Races_Standardized +
Number_Standardized + length_model_no_price_pred + length_model_price_pred +
place_model_price_pred - 1, data=x))
答: 暂无答案
评论