plyr 问答列表

当新序列在数据帧中开始时标识第一行

作者:Daniel AG 提问时间:4/8/2023

我有一个更大的数据集,其中包含很多序列。例: Number <- c(1, 1, 1, 1, 2, 2, 2, 2) Day <- c(1, 2, 3, 4, 1, 2, 3, 4) Letter ...

如何在 R 的 data.table 中使用切片 [duplicate]

作者:Victor Hartman 提问时间:1/8/2023

这个问题在这里已经有答案了: 按组提取与变量最小值对应的行 (8 个答案) 11个月前关闭。 我有一个包含 200.000+ 行的大型数据集。我想按两列对其进行分组,根据另一列进行过滤,同时保留所有...

完成序列列名称并填充 R

作者:VR28 提问时间:1/29/2023

我有类似于以下内容的大数据: week_0<-c(5,0,1,0,8,1) week_4<-c(1,0,1,0,1,1) week_8<-c(1,0,6,0,0,0) week_9<-c(2,4,1...

在一列中连接列名,条件是使用 mutate、across 和 case_when

作者:TarJae 提问时间:5/30/2021

我想: 使用并检查列 A1-A3 == 1acrosscase_when 连接列的列名,其中 A1-A3 == 1 和 使用串联的列名改变新列 我的数据帧: df <- tribble( ~ID...

在 R 中根据条件创建唯一组合的变量

作者:Mark Noble 提问时间:12/10/2022

在以下数据帧中 structure(list(model = c("A1", "A1", "B4", "B4", "B4", "A4", "A4", "A4", "G4", "G4"), cate...

对固定总大小进行分层抽样,而不是分层大小

作者:Andy 提问时间:2/20/2023

我有一个数据集,我希望在给定变量中尽可能均匀地进行下采样。假设数据帧为 54 个观测值,并且下采样组的固定总大小设置为 25。但是,由于分层变量中的一些 n 很小,因此当我尝试均匀地选择数字时,它会出...

创建重复值序列,长度基于向量

作者:Stacey Harwood 提问时间:9/12/2023

如何用数字序列填充列“Night”,每个数字重复 3 次,并根据列“Site”重新开始序列?我创建了一个表格,显示我想要实现的目标。这是我问题的简化版本,我需要能够在更大的数据帧上使用代码。 表格图...

R - 按相对学期顺序总结课程注册情况

作者:Christian Million 提问时间:4/26/2019

应用问题 我想抽象出代码,总结 n 门课程和 n 个学期的一组学生的课程学习模式和成功率。 例 对于以下学生群体,有多少人在参加课程“A”后进入课程“B”,这些学生中有多少人成功了: data...

dplyr 按具有多个阈值的组对行进行子集

作者:Olaf Odinn 提问时间:9/20/2023

我目前正在尝试回答一个相当简单的问题:列出每个地区排名前 20% 的药店(以单位衡量)。 我首先测量了每家药房销售的产品数量,对其进行了 DESC 排序,并有以下 20% 的阈值: 以下是我计算数...

分组后,无法获取 dplyr 的切片来选择每个分组的前 3 名

作者:JTD 提问时间:11/24/2022

我试图根据l5_ppg_max只保留每个分组的前 3 条记录。此代码正确设置了表格,但是当我添加切片代码时,它没有选择每个组的前 3 条记录。 #library(reticulate) librar...


共231条 当前第2页