R 中多模态分布的回归分析方法和工具是什么?[已结束]

What method and tool for regression analysis for a multimodal distribution in R? [closed]

提问人:vp_050 提问时间:2/15/2022 更新时间:2/18/2022 访问量:279

问:


这个问题似乎不是关于帮助中心定义的范围内的编程。

去年关闭。

我有一组变量 X1 和 X2 以及 Y,其关系图如下所示。X2 值用于颜色编码。

X1、X2 和 X3 是整数变量。

enter image description here

观察到的模式是多模式的。

根据 X1 和 X2 预测 Y 的最佳方法是什么?

为此,我们可以使用非线性或障碍模型吗?

另外,在 R 中有哪些工具可用于实现此目的?

R 回归 非线性回归 多模态

评论

1赞 DanY 2/15/2022
这将作为 SO 的题外话而关闭 - 编码问题仅在此处:)但也许可以尝试样条曲线或其他 GAM(广义加法模型)

答:

1赞 Robert Long 2/15/2022 #1

一般来说,没有必要担心响应的分布。尽管您显示的是双变量图,但多模态可能由(或其他缺失变量)解释X2

重要的是模型残差的分布(如果它很重要的话)。

如果残差是非正态的,那么某些推论可能是无效的,尽管如果将模型用于预测,这可能根本不是问题。

如果你真的有曲线关联,那么你可以考虑:

  • 转换
  • 非线性项
  • 样 条
  • 广义加法模型 (GAM)
  • 非线性模型

当然,如果潜在的问题是缺少解释变量,那么其中一些方法可能会导致过度拟合模型。