有没有办法在 R 中使用数学序列方法对数据进行分类?

Is there a way to bin data using a mathematical sequence approach in R?

提问人:007123 提问时间:6/30/2023 最后编辑:007123 更新时间:6/30/2023 访问量:47

问:

我有 225,666 个数据点,每个数据点包含 74 个观测值。

我想对数据进行装箱以减少数据点的数量,从而提供更易于管理的数据分析。

但是,数据的排序方式并不特别明显。

1, 2, 3, 4, 5...378

379, 380, 381, 382...756

重复直到

225288, 225289, 225290...225666 (即每行 378 个日期点,共计 597 行)。

我想把这些数据装箱。

由于 225666 可以被 9 整除,我的想法是每个 bin 有 81 个数据点,即“x”方向的 9 个数据点(例如第 1 行中的 1-9),然后是“y”方向的相应 9 个数据点(例如 1、379、757......然后,我需要此 bin 中所有数据点的平均值。

目前,我已将该数据装箱到 25,074 个装箱中(即 9 的倍数,但在“x”方向上),但现在我想进一步装箱这些数据。**这可能不是尝试此挑战的最佳方式。 ** 我需要 bin 1、42、84、126...336(其中 9 个 bin 是 42 的倍数)来形成一个更大的 bin。然后我想重复一遍,所以我有 2、43、85、127、......337 形成第二个更大的箱子。然后这将循环,直到 41、125...377 形成一个箱子。我还需要 378、420、462......形成箱子,依此类推,直到我有 597 个更大的箱子。

除非有更有能力的方法来实现这一目标?

R 数学 序列 分箱

评论

0赞 IRTFM 6/30/2023
向我们展示文件在编辑器中的外观(或显示您是否已经完成了该步骤)str(dat)read.*
0赞 Gregor Thomas 6/30/2023
虽然 225,666 可以被 9 整除,但行计数 597 不能。因此,您可以将数据分箱到 9x9 的子方格中,但这样您就会剩下 3 行。
0赞 Gregor Thomas 6/30/2023
我必须承认,我也对结构感到困惑。您的第一行说“每个数据点包含 74 个观测值”,但 74 个数字没有再次提及 - 它如何相关?我想你是在告诉我们你的数据是一个 597 行 x 378 列的矩阵或数据框,但你没有直接这么说,所以我不太确定......是那个还是别的什么?有什么理由迭代地进行这种装箱,先制作小箱,然后再装箱?似乎直接计算你所追求的任何手段会更直接。
0赞 007123 6/30/2023
很抱歉造成任何混淆。该文件实际上是 225,666 行 x 74 列(观测值)。然而,这些对应于空间中的区域,因为前 378 行在 y 轴上都是恒定的,但会随着它们在 x 轴上的位置而变化。接下来的 378 条线位于不同的 y 轴上,但所有 378 条线都是恒定的,并且在 y 轴上也各不相同。至于迭代装箱,我认为这更容易开始,而不是尝试将 9 个相邻行与对应于相同 x 坐标但不同 y 坐标的 9 行装箱。但也许这对我来说过于复杂了?
0赞 007123 6/30/2023
1 2 3 4 ...378(下一行)// 379 380 381 382 ...756 ^^这就是获取数据的方式,如果你想象一个大正方形,那么每行收集的数据点为 597 行。每个数据点包含 74 个观测值(即有关该“像素”的信息)读出的数据为:第 1 行:1、2、3、4...74(其中每个数字都是一个有意义的观测值第 2 行:1、2、3、4...74 ...第 225,666 行:1,2,3,4...74 我知道第 1 行和第 2 行是相邻的,这意味着是相同的 y 轴平面。然后第 397 行与第 1 行是相同的 x 轴平面,但 y 坐标不同。希望这能澄清吗?

答: 暂无答案