R 中类别变量的两个以上水平的显著性检验
作者:Sophia L 提问时间:11/7/2023
我正在尝试确定两组之间具有 8 个级别的分类变量的频率是否存在显着差异。在这种情况下,两组被问到他们最喜欢的颜色,有 8 个选择。我想知道第 1 组的人选择颜色的频率与第 2 组的人选择相同颜色的频率...
分类 问答列表
作者:Sophia L 提问时间:11/7/2023
我正在尝试确定两组之间具有 8 个级别的分类变量的频率是否存在显着差异。在这种情况下,两组被问到他们最喜欢的颜色,有 8 个选择。我想知道第 1 组的人选择颜色的频率与第 2 组的人选择相同颜色的频率...
作者:Chethan 提问时间:11/1/2023
我正在处理二元分类任务,并希望了解将类阈值合并到我的模型中的最佳实践。具体来说,我希望确保模型不仅进行二元预测,而且还提供其在每个预测中的置信度的度量。 我正在考虑两种方法: 模型中的阈值:将类阈值...
作者:Bella_18 提问时间:10/6/2023
我正在尝试从我的数据中为标签子集创建一个混淆矩阵。尽管对行进行了错误分类,但生成的混淆矩阵在除对角线外的所有地方都显示零。我错过了什么吗? 代码如下: import pandas as pd fr...
作者:SH_IQ 提问时间:10/30/2023
我正在尝试了解 KNN(k 最近邻)在鸢尾花数据集分类方面的工作。据我了解,当我需要进行分类时,我必须将数据准备为数值。根据我遵循的以下代码,它没有将它们更改为数值。这是正确的吗?何时需要将它们更改为...
作者:PKB 提问时间:10/24/2023
编辑 根据到目前为止的答案(谢谢),我了解它是什么以及它的用途。/ 分类数组有什么用?它有一个常见的用例吗?CategoricalDTypeCategorical -- 我不明白 和 之间的区别...
作者:Hamza 提问时间:10/28/2023
我已经在语音识别上应用了 1D CNN,当我洗牌列时,我得到了不同的结果,例如,使用 matrix(:,[1 2 3]) 给出的分类结果与 matrix(:,[2 3 1]) 应该相同,我尝试过 rn...
作者:Zach 提问时间:10/25/2023
我有一个大约有 44 亿行的 csv 文件。它有 25 个分类列,所有列都是十六进制编码的整数,例如 和 。EE6B280010642AC00 我有一台具有 3TB RAM 的机器,用于加载数据集。...
作者:cake2244 提问时间:10/25/2023
因此,我的 R 数据集中有一个名为“RACE”的变量,具有不同的分类种族分类。我还有另一个变量,称为“ETHNICITY”,具有不同的分类种族分类。我想在我的数据集中创建一个名为“RACE/ETHNI...
作者:ericclapp 提问时间:10/24/2023
我有一个测试集和训练集。他们有一个城市列,一个(火车)有 290 个独特的,测试有 30 个。我希望有重叠,即伦敦、布里斯托尔在两组,但格洛斯特可能在一组而不是另一组。 我还想将这些城市编码为两个集...
作者:riccio777 提问时间:10/21/2023
我希望在使用 和 时获得类似的交叉验证结果,但它们差异很大:lgb.cvcross_val_score import lightgbm as lgb import pandas as pd from...