客户流失模型中的目标泄漏

Target leak in Customer Churn Model

提问人:Hitakshi Shah 提问时间:11/8/2023 更新时间:11/8/2023 访问量:11

问:

我正在研究客户流失模型,我有一些疑问,无法确认是否由于某些功能而存在目标泄漏。请在下面找到详细信息:

客户群:截至 22 年 12 月 22 日上线 响应(目标)定义:客户在本季度的银行余额下降了 60% 或更多:2 月 3 月 4 月 (FMA'23) 与去年同期相比:2 月 3 月 4 月 (FMA'22)

例如;如果客户在 2 月 3 月 4 月 (FMA'22) 的 AQB(平均季度余额)为 1,00,000 卢比,而在 2 月 3 月 4 月 (FMA'23) 降至 40,000 卢比,那么该客户将成为我们的目标(目标 = 1)

问题陈述:

在拟合预测模型时,我应该使用 FMA'22 的 AQB 作为特征,还是会导致目标泄漏(因为它被用于目标计算)。

我在这两种情况下都拟合了一个模型:

  1. 使用 FMA'22 AQB(召回率:90%)
  2. 未使用 FMA'22 AQB(召回:78%)

如果我在输入特征中不使用 PRE-AQB (FMA'22),模型性能会大幅下降 12%。

请求您的帮助以了解这是否是目标泄漏的情况?

我在这两种情况下都拟合了一个模型:

  1. 使用 FMA'22 AQB(召回率:90%)
  2. 未使用 FMA'22 AQB(召回:78%)

如果我在输入特征中不使用 PRE-AQB (FMA'22),模型性能会大幅下降 12%。

请求您的帮助以了解这是否是目标泄漏的情况?

输入 统计 预测 特征选择 数据科学 经验

评论


答:

0赞 Vishrut Thakur 11/8/2023 #1

您是否尝试过使用卡方计算特征相关性的热图,然后使用克莱默的 V。请在删除一些高度相关的功能(>.30)后仔细阅读并尝试训练。