分类数据 问答列表

在 R 或 python 中将 40 亿个十六进制整数转换为十进制整数的有效方法

作者:Zach 提问时间:10/25/2023

我有一个大约有 44 亿行的 csv 文件。它有 25 个分类列,所有列都是十六进制编码的整数,例如 和 。EE6B280010642AC00 我有一台具有 3TB RAM 的机器,用于加载数据集。...

pd.Categorical 和 pd.api.types.CategoricalDtype

作者:PKB 提问时间:10/24/2023

编辑 根据到目前为止的答案(谢谢),我了解它是什么以及它的用途。/ 分类数组有什么用?它有一个常见的用例吗?CategoricalDTypeCategorical -- 我不明白 和 之间的区别...

R 中类别变量的两个以上水平的显著性检验

作者:Sophia L 提问时间:11/7/2023

我正在尝试确定两组之间具有 8 个级别的分类变量的频率是否存在显着差异。在这种情况下,两组被问到他们最喜欢的颜色,有 8 个选择。我想知道第 1 组的人选择颜色的频率与第 2 组的人选择相同颜色的频率...

当我想对 cum sum ~5000 个类别进行 cumsum 时,我可以在 pandas 中使用 cumsum 吗?

作者:Samuel Frankland 提问时间:11/9/2023

我正在寻找一种方法来获取每个 %Entity_Acc 类别的PERIOD_BAL的累积总和。 这可以用cumsum来完成吗,还是有其他方法可以做到这一点? 我对编程比较陌生,到处都有蜜蜂搜索,试图...

tbl_summary,有没有办法按行和列比较分类数据?(费舍尔精确检验;Pearson's 卡方检验)

作者:Colin Doherty 提问时间:11/11/2023

表中有多个类别。下面我描述一个变量作为示例,希望它可以应用于变量。 目前,我的代码比较了女性和男性食品控制分数列。但是,食品控制评分有两个级别(“正常”和“高”)。有没有办法使用具有连续性校正的 1...

3 个分类变量的简洁可视化(最多 5 个!

作者:rmc 提问时间:11/15/2023

可视化 3 个分类变量(每个变量超过 10 个级别)的巧妙方法是绘制一个堆叠条形图,显示 var2 和 var3 的每个组合的 var1 中级别的(加权)比例。您将拥有一个网格,其中的单元格数量等于 ...


共16条 当前第2页