使用 VIF 在岭回归中选择 Lambda:这种方法是否有效?

Using VIF to Select Lambda in Ridge Regression: Is This Approach Valid?

提问人:HiddenLeafCoder 提问时间:11/8/2023 更新时间:11/8/2023 访问量:8

问:

我最近看到一篇文章,建议根据方差膨胀因子 (VIF) 值在岭回归中选择 lambda 参数。该方法旨在选择确保所有 VIF 值都低于特定阈值的 lambda,目的是减少多重共线性。

据我了解,VIF 是根据预测变量的相关矩阵计算得出的,它不应该随着脊回归的应用而改变,因为预测变量值本身不会因正则化而改变。我的理解是,VIF 的典型用途是在模型拟合之前作为诊断工具,并且通常根据交叉验证等预测性能指标来选择 lambda。

这篇文章似乎提出了一个迭代过程来调整岭回归中的λ,通过减少多重共线性对系数的影响来间接影响VIF计算。

以下是我的问题:

  1. 如果出现以下情况,应用岭回归将如何影响模型的 VIF VIF 计算仅基于两者之间的相关性 预测?
  2. 为岭选择 lambda 是否有效 基于达到一定的VIF值阈值的回归?
  3. 如果这种方法是非常规的,那么理论上可能是什么 对 lambda 使用 VIF 后岭正则化的理由 选择?

如能对这一方法作出任何澄清或参考支持这一方法的文献,将不胜感激。

链接到我引用的文章:估计岭回归 Lambda https://real-statistics.com/multiple-regression/ridge-and-lasso-regression/estimating-ridge-regression-lambda/

统计 重共线性 方差-通货膨胀因子

评论


答: 暂无答案