python中多个变量和组的显著性的n因子方差分析检验

n-way ANOVA test of signifance for multiple variable and groups in python

提问人:ApaarBawa 提问时间:10/11/2023 更新时间:10/11/2023 访问量:42

问:

我有一个包含列的数据框:“category”、“count”和“phase”。示例数据如下所示:

类别 计数 阶段
国际政治 4221 阶段0
经济 6182 第1阶段
国内事务 1151 阶段0
职业 1892 阶段0
战斗 1122 阶段0
国内事务 4221 第二阶段
国际政治 611 第二阶段
国际政治 918 第三阶段
经济 4282 第三阶段
国际政治 6212 第5阶段
职业 5142 第4阶段

每个阶段(phase0、phase1、phase2 等)可以具有不同数量的唯一对应类别。例如,phase0 唯一类别是:国际政治、国内事务、战斗,phase3 唯一类别是:国际政治、经济。计数是给定阶段的类别计数。

我的目标是检查这些类别在各个阶段是否具有统计学意义。我正在尝试使用 n 因素方差分析检验。我按照本网站提供的说明进行操作。但是,我仍然对如何实现它感到困惑。我该如何实现?

提前致谢!!

Python 熊猫 方差分析 假设检验

评论

0赞 Onyambu 10/11/2023
N-Way 方差分析用于测试不同组的均值。你有计数数据。您确定这里需要 2 路方差分析吗?请注意,您没有重复。你所说的跨阶段的类别在统计上显着是什么意思??你的意思是类别取决于阶段吗?- 独立性检验,类别的均值相同/不同,控制相位 - 2 路方差分析/RBD。我怀疑陈述类别在各个阶段都很重要,这是否有意义
0赞 ApaarBawa 10/11/2023
@Onyambu感谢您的回复。是的,我想表明类别取决于阶段。让我提供一些背景信息。通过说类别在各个阶段都很重要,我想得出结论,这些类别不会随机出现在各个阶段。它们在某种意义上是相关的。这在我的用例中非常重要。
0赞 Onyambu 10/11/2023
这是一个 chisq 测试,而不是方差分析测试。我相信你正在寻找chisq测试
0赞 ApaarBawa 10/13/2023
@Onyambu 我用于方差分析的公式是:count ~ C(类别) + C(相位) + C(类别):C(相位)。chatgpt 为给定公式和表格提供的原假设的解释为:交互效应 (C(category):C(phase))。H0:类别对计数的影响在所有阶段级别上都是相同的,反之亦然。换言之,类别和阶段之间不存在交互作用。H1:类别对计数的影响因不同阶段而异,反之亦然。换言之,类别和阶段之间存在交互作用。解释正确吗?

答: 暂无答案