data.table 问答列表

准确了解 data.table 何时是另一个 data.table 的引用(而不是副本)

作者:Peter Fine 提问时间:4/19/2012

我在理解 的引用传递属性时遇到了一些麻烦。有些操作似乎“破坏”了引用,我想确切地了解发生了什么。data.table 在从另一个(通过 ,然后通过 更新新表时,原始表也会被更改。这是预期的,如下所示...

无法获取:一个输入文件中缺少但存在于其他文件中的列应在输出文件中返回 NA

作者:Alexia k Boston 提问时间:7/17/2023

我有各种txt文件,其中每个文件都包含多个列,但并非所有列都存在于所有文件中。 例如 Txt 文件1 的列 D/T City_Name Temp Pres Wind_Hor Wind_Ver S_...

将列中以逗号分隔的字符串拆分为单独的行

作者:RoyalTS 提问时间:12/8/2012

我有一个数据框,如下所示: data.frame(director = c("Aaron Blaise,Bob Walker", "Akira Kurosawa", "Alan J. Pakul...

汇总/汇总每组的多个变量(例如总和、平均值)

作者:MikeTP 提问时间:3/15/2012

从数据框中,有没有一种简单的方法可以同时聚合(、等)多个变量?summeanmax 以下是一些示例数据: library(lubridate) days = 365*2 date = seq(as...

R 函数由 value 调用,而不是对事先调用 names() <- 的 data.table 的引用

作者:MEcon 提问时间:5/31/2023

我们知道有 4 种数据类型提供可变对象或按引用传递语义,并且是其中之一。(R 的最佳编码实践第 11 章Rdata.table) 在下面的一段代码中,首先我创建一个函数,该函数将向输入 data.t...

如何在输出csv中添加一个新列,其名称来自输入文件?

作者:Alexia k Boston 提问时间:7/14/2023

我有多个txt文件存储在不同的文件夹中。每个城市 1 个文件夹。每个 txt 文件以 5 分钟的间隔包含数据。我运行以下代码以成功获取每日数据。 for (idx in seq_along(dirl...

匹配 data.table 和 matrix 并计算新列

作者:Ann 提问时间:10/12/2023

我有两个data.tables“通勤者”和“距离”。距离是一个巨大的距离矩阵,具有行和列索引。通勤者有一个列“家”和“目的地”。 通勤者(1646044排): 家 目的地 2 2 1 2 3 3 ...

rbindlist 在 R 中具有不同的变量名称/位置:创建输出数据帧/文件

作者:Eric Boorman 提问时间:8/21/2023

我有一个问题,是两个不同帖子的组合。 合并 (rbind) 数据框并创建具有原始数据框名称的列 在 R 中比较多个 CSV 文件的列名 我正在尝试将多个文件放在一个文件夹中。我的一些变量在一个文...

配对两列的每个组合,并计算 data.table 中第三列的总和

作者:Ann 提问时间:9/7/2023

我有两个非常大的 df:df 1 和 df2。Df 1 包含“from”、“to”和“count”列。“from”和“to”中的值表示通勤点,可以多次出现: 从1 排 计数 10020 10020 ...

将列中的值替换为具有模式的前值

作者:Park 提问时间:2/3/2023

假设我们将数据框定义为x x <- data.frame(a = c('Start : 20220101', '1', '1', '1', 'Start : 20220102', '2', '2',...


共64条 当前第2页