data.table 问答列表

将 data.frame 从宽格式调整为长格式

作者:mropa 提问时间:2/2/2010

我从宽桌转换为长桌时遇到了一些麻烦。 目前它看起来像这样:data.frame Code Country 1950 1951 1952 1953 1954 AFG Afghanistan 20,24...

来自两个(或多个)向量的所有元素的唯一组合

作者:Godel 提问时间:7/9/2012

我正在尝试从 R 中两个不同大小的向量创建所有元素的独特组合。 例如,第一个向量是 a <- c("ABC", "DEF", "GHI") 第二个是当前存储为字符串的日期 b <- c("2...

setDT() 有意外的副作用 [duplicate]

作者:Robert Hadow 提问时间:7/10/2018

这个问题在这里已经有答案了: 准确了解 data.table 何时引用(与副本)另一个 data.table (2 个答案) 什么时候应该使用 setDT() 而不是 data.table() 来创建...

将 NA 替换为最新的非 NA 值

作者:Ryogi 提问时间:10/12/2011

在 (或 ) 中,我想用最接近的先前非 NA 值“向前填充”NA。使用向量(而不是 )的简单示例如下:data.framedata.tabledata.frame > y <- c(NA, 2, 2...

准确了解 data.table 何时是另一个 data.table 的引用(而不是副本)

作者:Peter Fine 提问时间:4/19/2012

我在理解 的引用传递属性时遇到了一些麻烦。有些操作似乎“破坏”了引用,我想确切地了解发生了什么。data.table 在从另一个(通过 ,然后通过 更新新表时,原始表也会被更改。这是预期的,如下所示...

data.table() 根据列顺序给出虚假结果

作者:Robert Hadow 提问时间:7/2/2018

我创建了一个十行数据帧,然后将其转换为数据表。我用不同的列顺序再次创建了它。当我将其转换为数据表时,结果是虚假的。 c <- pi e <- paste("lotsa text, line", ...

计算效率高的方法来操作大型深度嵌套对象的级别?

作者:Sudoh 提问时间:7/13/2023

我有一个向量列表列表(不是错别字,再次确认它实际上是一个向量列表列表),长度为 7600 万。因此,有一个包含 7600 万个项目的列表,其中每个项目都是两个向量的列表。 所有向量均为均匀长度(6 ...

如何检查 R 中包含混合字母数字索引的列中的重叠

作者:Hong 提问时间:10/5/2023

我有一个数据帧,其中一列包含由字母后跟 3 位数字组成的代码字符串。我想检查各行之间的代码是否存在重叠。 例如(请注意,row1 和 row2 之间有一个重叠 (B258): df <- data...

如何在 R 的 data.table 中使用切片 [duplicate]

作者:Victor Hartman 提问时间:1/8/2023

这个问题在这里已经有答案了: 按组提取与变量最小值对应的行 (8 个答案) 11个月前关闭。 我有一个包含 200.000+ 行的大型数据集。我想按两列对其进行分组,根据另一列进行过滤,同时保留所有...

Data.Table 对象在函数中分配了 := 未打印

作者:janosdivenyi 提问时间:10/7/2015

我想修改一个函数。如果我在函数中使用该功能,则仅在第二次调用时打印结果。data.table:= 请看下图: library(data.table) mydt <- data.table(x = ...


共64条 当前第1页