提问人:mel099 提问时间:8/8/2023 更新时间:8/8/2023 访问量:33
如何在不耗尽内存的情况下在 R 中对数据帧进行采样
how to sample a data frame in R without exhaust the memory
问:
我正在尝试对包含两列的数据帧进行采样,一列是 ID,一列是计数。计数的总和是 10^13,我想将大小采样为 10^12 、10^11 等。但
向量超出了 R 的限制。
如何对此类数据进行采样?
df_random[[i]]= df2 %>% mutate(ID=factor(ID)) %>% %>%
tidyr::uncount(count) %>% sample_n(nrow(.)) %>%
sample_n(size=round(n/fold2),replace = TRUE) %>% count(ID, name = "value", .drop=FALSE)
}
答: 暂无答案
评论
bigmemory
dplyr::slice_sample(weight_by = count)
df2