提问人:vp_050 提问时间:2/15/2022 更新时间:2/18/2022 访问量:279
R 中多模态分布的回归分析方法和工具是什么?[已结束]
What method and tool for regression analysis for a multimodal distribution in R? [closed]
问:
我有一组变量 X1 和 X2 以及 Y,其关系图如下所示。X2 值用于颜色编码。
X1、X2 和 X3 是整数变量。
观察到的模式是多模式的。
根据 X1 和 X2 预测 Y 的最佳方法是什么?
为此,我们可以使用非线性或障碍模型吗?
另外,在 R 中有哪些工具可用于实现此目的?
答:
1赞
Robert Long
2/15/2022
#1
一般来说,没有必要担心响应的分布。尽管您显示的是双变量图,但多模态可能由(或其他缺失变量)解释X2
重要的是模型残差的分布(如果它很重要的话)。
如果残差是非正态的,那么某些推论可能是无效的,尽管如果将模型用于预测,这可能根本不是问题。
如果你真的有曲线关联,那么你可以考虑:
- 转换
- 非线性项
- 样 条
- 广义加法模型 (GAM)
- 非线性模型
当然,如果潜在的问题是缺少解释变量,那么其中一些方法可能会导致过度拟合模型。
评论