为具有交互作用的多因素方差分析添加对比

Adding contrasts to multifactorial ANOVA with interactions

提问人:Alex W 提问时间:11/12/2023 最后编辑:Alex W 更新时间:11/12/2023 访问量:18

问:

我有一个数据集,我正在检查其中,一个因子有 20+ 个水平,其他因子有 ~2-5 个水平。如果我要运行传统的事后测试,例如 tukeys,它将消耗太多的自由度,并回答一系列我不感兴趣的关于 20+ 级因子的问题。我的印象是,我需要使用对比来只检查与我的研究相关的相互作用类型。

下面是一些类似的虚拟数据

fruit<-c("Apple","Apple","Apple","Apple","Pear","Pear", "Pear", "Pear","Quince","Quince","Quince","Quince","Strawberry","Strawberry","Strawberry"  ,"Strawberry", "Blueberry", "Blueberry", "Blueberry", "Blueberry","Blackberry","Blackberry","Blackberry","Blackberry","Apple","Apple","Apple","Apple","Pear","Pear", "Pear", "Pear","Quince","Quince","Quince","Quince","Strawberry","Strawberry","Strawberry"  ,"Strawberry", "Blueberry", "Blueberry", "Blueberry", "Blueberry","Blackberry","Blackberry","Blackberry","Blackberry") 
pesticide<-c('Yes','no','yes','no','Yes','no','yes','no','Yes','no','yes','no','Yes','no','yes','no','Yes','no','yes','no','Yes','no','yes','no','Yes','no','yes','no','Yes','no','yes','no','Yes','no','yes','no','Yes','no','yes','no','Yes','no','yes','no','Yes','no','yes','no')
potsize<-c('small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large','small','medium','large')
weight<-c(75,90,80,100,150.160,135,162,120,122,117,130,120,15,14,13,17,1,0.5,0.3,0.4,1.2,2,1.9,3,76,130,65,90,150,170,137,125,140,119,135,140,12,18,17,20,0.9,0.6,0.2,0.8,1.6,1.9,1.8,2.2)

Data<-data.frame(fruit,pesticide,potsize,weight)
Data$fruit<-as.factor(Data$fruit)
Data$pesticide=factor(Data$pesticide)
Data$potsize=factor(Data$potsize, order=TRUE,levels=c("small",'medium','large'))

所以我感兴趣的事情是:

  1. 农药的使用对果实大小有一般影响吗
  2. 使用杀虫剂对特定水果有影响吗
  3. 使用杀虫剂对浆果的影响是否与梨果不同
  4. 花盆大小会影响农药对果实大小的影响吗
  5. 花盆大小是否会影响农药对特定水果大小的影响

我不感兴趣的是:

  1. 是比蓝莓重的苹果
  2. 其他毫无意义的成对比较,例如用杀虫剂种植的蓝莓的质量与没有杀虫剂的苹果的质量不同。

我认为(可能被误导了)我可以使用对比来回答我想回答的问题,同时为残余误差保留一些自由度。但我不确定如何以捕获多个因素的方式对对比进行编码(我只在网上看到过一个因素的例子),此外,由于我的数据集非常大,我希望有一种方法可以做到这一点,而无需制作巨大的对比度值列表(愿意接受它可能是不可避免的)

无论如何,这里有一些运行方差分析和 tukeys HSD 测试的代码

fit<-aov(weight~fruit*pesticide*potsize,data=Data)
summary(fit)
TukeyHSD(fit)

另外,我想知道为什么 fruit:potsize 只使用 4 个自由度,而在我看来它可能应该使用 15 个自由度?我知道 3 向交互是不可能的,因为它会消耗太多的自由度,但我的印象是,如果有足够的可用剩余自由度,它的计算公式为(因子 A 水平的数量)x(因子 B 水平的数量)

对此的任何帮助将不胜感激 谢谢

r 方差 分析相互作用 事后 比较对比

评论


答: 暂无答案