提问人:Gian Marino 提问时间:11/16/2023 最后编辑:Timur ShtatlandGian Marino 更新时间:11/17/2023 访问量:22
检查增长率显着差异的最合适的统计检验是什么?
What is the most appropriate statistical test to check for significant differences in growth rates?
问:
我有一个商业性能数据集,如下所示:
客户端类型 | 渠道 | %growth_vol |
---|---|---|
大型零售业 | 一个 | 9% |
大型零售业 | B | 7% |
中型零售 | 一个 | 11% |
中型零售 | B | 18% |
小型零售 | 一个 | 21% |
小型零售 | B | 16% |
我正在衡量客户群在一段时间内的数量增长。唯一的效果区别是它们通过哪个分销渠道(A,B)进入市场。每个集群之间的客户端是不同的(大型零售商要么通过 A 进入市场,要么通过 B 进入市场,从不切换),并且集群内非常同质化。上表只是一个摘要。我确实拥有完整的数据集,其中包含 2000+ 客户及其各自的增长、集群、渠道等。 我的目标是确定给定客户类型的渠道之间的增长率是否存在显着差异,即渠道选择是否对绩效有影响。例如,9%与大型零售商的7%有很大不同。
我最初采用的是双样本 T 检验(独立样本),注意数据组的方差相等并相应地进行调整(如果是,则直接使用 t 检验;如果不是,则使用 Welch 的 t 检验)。顺便说一句,我使用的是 python 的 .Statsmodels
我目前不确定,因为我一直使用 t 检验来衡量绝对属性,例如重量、大小、速度等。我现在正在探索增长率这一事实无疑让我对它的正确用法感到有些不安。
我使用 t 检验是否正确?有没有更好/正确的测试?
答:
0赞
Timur Shtatland
11/17/2023
#1
是的,这就是我会做的。不过,我不会检查方差是否相等,因为这有点矫枉过正。我会对所有事情都使用 Welch 的 t 检验。
不过,我会首先看一下每个因子的分布(在你的情况下是通道)。如果它们肉眼看起来正常,请使用上述 t 检验。否则,请使用 Mann-Whitney U 检验。
如果你想非常小心,除了用肉眼估计之外,还要测试正常性。有很多正态性检验,请参阅正态性检验。我通常使用 Shapiro-Wilk 测试,但 YMMV.
评论