分类数据 问答列表

将哪个相异性指数用于分类生态数据

作者:Fabi B 提问时间:11/16/2023

我目前正在研究以分类方式表示微生物丰度的数据,例如 0 = 没有生物;1 = 1-5 个生物体;2 = 6-10,依此类推(5 为最高数字)。而且我不太确定哪种差异指数最适合与 vegdist 一起使...

带有类.ind()的多级因子的整数溢出?

作者:Hack-R 提问时间:12/19/2015

我正在尝试将一个“大”因子转换为 R 中的一组指标(即虚拟、二进制、标志)变量,如下所示: FLN <- data.frame(nnet::class.ind(FinelineNumber)) ...

如何比较分类响应变量的连续数据?

作者:Zaara Kidwai 提问时间:9/11/2023

对于一个非常基本的问题,我深表歉意,但我有一个分析块(类似于作家的块)。我有以下数据: Location<-c(Site1, Site2, Site 3) Rainfall <-c(34.5,54....

如何按字符串索引的自定义顺序对 pandas 数据帧进行排序

作者:littleworth 提问时间:4/25/2018

我有以下数据帧: import pandas as pd df = pd.DataFrame({'id': [2967, 5335, 13950, 6141, 6169], 'Player': ...

如何在数据透视表中添加两列 (Excel)

作者:lorena 提问时间:9/20/2023

我正在尝试找到一种在数据透视表中包含两个分类变量的方法?(而不是同一列中的下拉列表) 它自动工作的方式对于进一步操作数据并不真正实用,这似乎是一个简单的功能,我希望它必须存在于数据透视表设置中的某个地...

在电信数据的流失预测模型中处理分类缺失数据 [已关闭]

作者:Ashish Padhi 提问时间:10/1/2023

闭。这个问题与编程或软件开发无关。它目前不接受答案。 这个问题似乎与特定的编程问题、软件算法或程序员主要使用的软件工具无关。如果您认为该问题在另一个 Stack Exchange 站点上是主题,您可...

R:使用有序分类变量模拟纵向数据

作者:Armel Soubeiga 提问时间:9/30/2023

我正在尝试为我的研究模拟纵向数据。数据必须包含一个分类变量和另一个有序分类变量。为此,我使用了 R 包,它可以模拟纵向数据。simstudy 1- 对于简单的分类变量(),我可以使用以下代码来做到这...

根据分类变量的两个元素的有序分类比较它们

作者:quesadagranja 提问时间:10/9/2023

在 Python 中,我创建了一个分类变量,如下所示: x = pd.Categorical(["Hi", "Lo", "Med", "Zer", "Lo", "Zer", "Lo", "Hi"],...

在 Y 轴上对重新标记的数据进行重新排序

作者:AL B 提问时间:10/18/2023

我有一个数据集,x是一个元组整数: [1,2,3,4,5,6,7,8,9,10,...40] y 是字符串元组 ['5', '2', '5', '2', '5', '2', '5', '2', ...

测试和训练数据具有不同的城市,如何查找和区别,并在测试和训练数据的两列上使用相同的编码系统进行编码

作者:ericclapp 提问时间:10/24/2023

我有一个测试集和训练集。他们有一个城市列,一个(火车)有 290 个独特的,测试有 30 个。我希望有重叠,即伦敦、布里斯托尔在两组,但格洛斯特可能在一组而不是另一组。 我还想将这些城市编码为两个集...


共16条 当前第1页