对固定总大小进行分层抽样,而不是分层大小
作者:Andy 提问时间:2/20/2023
我有一个数据集,我希望在给定变量中尽可能均匀地进行下采样。假设数据帧为 54 个观测值,并且下采样组的固定总大小设置为 25。但是,由于分层变量中的一些 n 很小,因此当我尝试均匀地选择数字时,它会出...
ply 问答列表
作者:Andy 提问时间:2/20/2023
我有一个数据集,我希望在给定变量中尽可能均匀地进行下采样。假设数据帧为 54 个观测值,并且下采样组的固定总大小设置为 25。但是,由于分层变量中的一些 n 很小,因此当我尝试均匀地选择数字时,它会出...
作者:Stacey Harwood 提问时间:9/12/2023
如何用数字序列填充列“Night”,每个数字重复 3 次,并根据列“Site”重新开始序列?我创建了一个表格,显示我想要实现的目标。这是我问题的简化版本,我需要能够在更大的数据帧上使用代码。 表格图...
作者:Christian Million 提问时间:4/26/2019
应用问题 我想抽象出代码,总结 n 门课程和 n 个学期的一组学生的课程学习模式和成功率。 例 对于以下学生群体,有多少人在参加课程“A”后进入课程“B”,这些学生中有多少人成功了: data...
作者:Olaf Odinn 提问时间:9/20/2023
我目前正在尝试回答一个相当简单的问题:列出每个地区排名前 20% 的药店(以单位衡量)。 我首先测量了每家药房销售的产品数量,对其进行了 DESC 排序,并有以下 20% 的阈值: 以下是我计算数...
作者:JTD 提问时间:11/24/2022
我试图根据l5_ppg_max只保留每个分组的前 3 条记录。此代码正确设置了表格,但是当我添加切片代码时,它没有选择每个组的前 3 条记录。 #library(reticulate) librar...
作者:Konrad 提问时间:12/21/2015
我想使用复合分配管道运算符。例如,使用下面的代码,我可以生成具有所需比例的简单数据框:%<>% data("mtcars") Vectorize(require)(package = c("magr...
作者:Bastian 提问时间:1/8/2021
假设我有一个简单的 data.frame: > d <- data.frame(A=1, B=2) 现在我想向它添加 3 列,{X, Y, Z} 存储在向量中。 让我们跳过原因,专注于解决方案。...
作者:Christopher 提问时间:4/2/2020
在 R 中,我们可以引用在同一列表中创建的项,即: list(a = a <- 1, b = a) 我很好奇是否有一种方法可以编写一个代替 .也就是说,如果像这样的东西a = a <- 1 `%...
作者: 提问时间:3/29/2020
我非常喜欢管道(在评论中提到的 dplyr 或 magrittr 中),但有时我会遇到错误,这表明我缺乏一些理解。对于其他函数或运算符,我至少对如何定义它们有一些想法,但是对于管道,如果我想定义它,我...
作者:Michael 提问时间:10/17/2023
这与我在这里发布的问题类似。 我使用包和函数来获取特定赛季的游戏列表及其相关信息。nhlapinhl_schedule_seasons 在 2023 赛季使用它,包括以下内容: install....