分析多个分类性状和一个连续性状

Analysis for many Categorical and one Continuous trait

提问人:Batro 提问时间:10/14/2023 更新时间:10/14/2023 访问量:20

问:

我的数据集包含多个名义非二元变量(即喙形状类型、一般眼睛位置),这些变量被表示/编码为数字。例如,对于“喙形状类型”,有 4 个选项,1-4,每个选项代表不同的形状。这些变量不是有序的。我还有一个连续变量——栖息地湿度。我试图找到一个合适的分析来阐明这个连续变量和名义变量之间的关系。但是我是统计新手,所以遇到了麻烦。

据我所知,多变量回归是不合适的,因为这需要我的类别是有序的/排名的。我还认为,为这些数据获取“相关系数”并没有真正的意义,因为没有理由假设我的 4 个喙形状类别与我的连续变量之间存在线性关系。我尝试了“MANCOVA”,但似乎这种方法将我所有的名义变量视为一个块,而我正在寻找各个变量的关系。我目前的理解是“方差分析”是最好的选择。我可以对每个变量进行方差分析,并查看它与连续变量的关系。

我在 R 中对我的一些名义变量进行了方差分析。我得到的结果是 Df、Sum Sq、Mean Sq、F 值、Pr(>F) 和残差。我真的不知道这些值的意义,除了 Pr(>F) 基本上就像一个 p 值,告诉我这种关系是否具有统计意义。据我所知,它并没有真正给我任何价值来量化关系的强度(或者在这种情况下,p 值基本上是告诉我关系的强度吗?因此,我还考虑对于每个重要的名义变量,以获得变量中每个类别的平均栖息地湿度。这样,我就可以将这种关系表示为:“喙的形状与栖息地湿度高度显着相关(此处的 p 值),以下是它的关系(显示每种喙形状类型的平均栖息地湿度)”。您如何看待我的方法?方差分析是一个合适的选择吗?这是找出我的哪些名义性状与栖息地湿度最相关的合理方法吗?我所说的话/我的思维过程是否不正确?由于我是统计学的初学者,如果您能在回答中淡化技术术语,我将不胜感激。

统计 关系 生物信息学 相关 方差分析

评论

0赞 Robert Dodier 10/14/2023
然而,有趣的问题在这里偏离了主题;试试 stats.stackexchange.com。
0赞 Batro 10/15/2023
明白了。谢谢,我会把它贴在那里。

答: 暂无答案