分箱 问答列表

有没有办法在 R 中使用数学序列方法对数据进行分类?

作者:007123 提问时间:6/30/2023

我有 225,666 个数据点,每个数据点包含 74 个观测值。 我想对数据进行装箱以减少数据点的数量,从而提供更易于管理的数据分析。 但是,数据的排序方式并不特别明显。 1, 2, 3, 4,...

PySpark 中具有有意义的存储桶名称的存储桶数据名称

作者:Minura Punchihewa 提问时间:7/11/2023

我在 PySpark 中有一个函数,可以使用 .由于返回存储桶的数值,因此我还有另一个函数,称为 main 函数 create bucket names 中,这是有意义的。BucketizerBuck...

Python 函数 根据给定的时间间隔将整数转换为 bins

作者:Arun Kumar Khattri 提问时间:7/18/2023

我正在尝试根据给定的时间间隔将整数 () 转换为 bins。 箱大小(间隔)为num[1, 200), [200, 400), [400, 800), [800, 1200), [1200, num]...

如何使用 matplotlib 的 hist() 函数绘制“binned data”的图形

作者:user19888430 提问时间:7/20/2023

我是matplotlib的新手。我有数据分箱数据。 Level Quantity 0 (199.533, 271.74] (10.213, 39.4] 1 (199.533, 271.74] (1...

移位直方图分档时的小泄漏

作者:C. Nielsen 提问时间:7/28/2023

尝试将一些代码放在一起,用于根据简单的百分比分箱直方图分析降级的正态分布,并可以选择将百分比分箱移到非 P50 零值附近。 我将一个可重现的示例归结为以下代码: import random imp...

(R) 装箱数值列以计算分组后出现的次数

作者:ZainNST 提问时间:8/11/2023

如果帖子的标题有点令人困惑,我们深表歉意。假设我有以下数据框: set.seed(123) test <- data.frame("chr" = rep("chr1",30), "position"...

Binning 以离散化 python 中的数值变量 [duplicate]

作者:Dag2 提问时间:8/19/2023

这个问题在这里已经有答案了: 按值分箱,最后一个 bin [duplicate] 除外 (1 个答案) 熊猫切割无限上限/下限 (3 个答案) 3个月前关闭。 我想将数据框的数值变量装箱,使其成为分...

在直方图中重新装箱计数 (Python)

作者:cr_007 提问时间:9/7/2023

我在 Python 中使用两个数据集(tof_n22 和 tof_n30),我需要重新装箱数据并将其绘制为另一个直方图。这两个数据集是中子飞行时间数据,我正在尝试根据测量的中子能量重新装箱这些数据。我...

如何在 gnuplot 或 python 中进行数据分箱?

作者:Rabia Sönmez 提问时间:9/9/2023

我正在尝试在 python 中进行数据分箱。我想得到的图表是original_graph。但我越来越my_plot。我想将数据装箱为纬度 2 度范围和海拔 100 公里范围。等待您的帮助,我的代码如下...

有没有办法将 pd.cut() 中的cut_bins值保存和使用到不同的文件中

作者:SM079 提问时间:9/30/2023

我正在使用 pd.cut() 对 df 中的数字列进行装箱,如下所示 train_df['bucket'], cut_bins = pd.qcut(train_df['rank'] , q=10, ...


共14条 当前第1页