提问人:Hitakshi Shah 提问时间:11/8/2023 更新时间:11/8/2023 访问量:11
客户流失模型中的目标泄漏
Target leak in Customer Churn Model
问:
我正在研究客户流失模型,我有一些疑问,无法确认是否由于某些功能而存在目标泄漏。请在下面找到详细信息:
客户群:截至 22 年 12 月 22 日上线 响应(目标)定义:客户在本季度的银行余额下降了 60% 或更多:2 月 3 月 4 月 (FMA'23) 与去年同期相比:2 月 3 月 4 月 (FMA'22)
例如;如果客户在 2 月 3 月 4 月 (FMA'22) 的 AQB(平均季度余额)为 1,00,000 卢比,而在 2 月 3 月 4 月 (FMA'23) 降至 40,000 卢比,那么该客户将成为我们的目标(目标 = 1)
问题陈述:
在拟合预测模型时,我应该使用 FMA'22 的 AQB 作为特征,还是会导致目标泄漏(因为它被用于目标计算)。
我在这两种情况下都拟合了一个模型:
- 使用 FMA'22 AQB(召回率:90%)
- 未使用 FMA'22 AQB(召回:78%)
如果我在输入特征中不使用 PRE-AQB (FMA'22),模型性能会大幅下降 12%。
请求您的帮助以了解这是否是目标泄漏的情况?
我在这两种情况下都拟合了一个模型:
- 使用 FMA'22 AQB(召回率:90%)
- 未使用 FMA'22 AQB(召回:78%)
如果我在输入特征中不使用 PRE-AQB (FMA'22),模型性能会大幅下降 12%。
请求您的帮助以了解这是否是目标泄漏的情况?
答:
0赞
Vishrut Thakur
11/8/2023
#1
您是否尝试过使用卡方计算特征相关性的热图,然后使用克莱默的 V。请在删除一些高度相关的功能(>.30)后仔细阅读并尝试训练。
上一个:机器学习机场空侧预测 KPI
下一个:有关生存树中的分区的信息
评论