提问人:Sonnie Kariuki 提问时间:9/26/2023 更新时间:9/26/2023 访问量:12
如何使用另一个值填充列中的缺失值(longtidunal 数据集)
How to fill missing values in a column using another value (longtidunal dataset)
问:
假设我有 longitidunal 数据集 (df),该数据集由 12 个波组成,具有四个变量和两个长格式的个体:-
id<- c(“1”, “1”, “1”, “1”,“1”, “1”,“1”, “1”, “1”, “1”, “1”, “2”, “2”, “2”, “2”, “2”, “2”, “2”, “2”, “2”, “2”, “2”) 波<- C(“a”, “b”, “c”, “d”,“e”, “f”, “g”, “h”, “i”, “j”,“k”, “l”, “a”, “b”, “c”, “d”,“e”, “f”, “g”, “h”, “i”, “j”,“k”, “l”) 国家<- c(“Bornuk”, “NA”,“NA”, “NA”,“NA”, “NA”,“NA”, “NA”, “NA”, “NA”, “NA”, “NA”) 教育<- c(“未受过教育”, “未受过教育”, “未受过教育”, “未受过教育”, “受过教育”, “受过教育”, “受过教育”, “受过教育”, “受过教育”, “受过教育”,
df <- as.data.frame(cbind(id, wave, country, education))
数据是长格式 id 波国家 1 1 1 1... 2 2 2 2 2...
wave(a,b,c,d 等)代表不同的时间点。id (1,2) 在唯一标识符国家/地区显示人员 1 出生在英国,但这在随后的波次中不会重复,对于未在英国出生的人 2 的教育显示人员 1 未受过教育,并且此信息在整个波次中保持不变,人员 2 受过教育,并且信息在波浪中是相同的。
国家变量数据仅在第一波中收集。在其他波浪中不重复。我想通过重复第一波的数据来填充从波次 b 到 k 次的信息。
我想过使用聚结,但我不确定如何。我试过了:-
df <- df %>%
arrange(id, wave) %>%
tidyr::fill(country, .direction ="down")
它什么也没给。请协助!
答: 暂无答案
评论