如何使用另一个值填充列中的缺失值(longtidunal 数据集)

How to fill missing values in a column using another value (longtidunal dataset)

提问人:Sonnie Kariuki 提问时间:9/26/2023 更新时间:9/26/2023 访问量:12

问:

假设我有 longitidunal 数据集 (df),该数据集由 12 个波组成,具有四个变量和两个长格式的个体:-

id<- c(“1”, “1”, “1”, “1”,“1”, “1”,“1”, “1”, “1”, “1”, “1”, “2”, “2”, “2”, “2”, “2”, “2”, “2”, “2”, “2”, “2”, “2”) 波<- C(“a”, “b”, “c”, “d”,“e”, “f”, “g”, “h”, “i”, “j”,“k”, “l”, “a”, “b”, “c”, “d”,“e”, “f”, “g”, “h”, “i”, “j”,“k”, “l”) 国家<- c(“Bornuk”, “NA”,“NA”, “NA”,“NA”, “NA”,“NA”, “NA”, “NA”, “NA”, “NA”, “NA”) 教育<- c(“未受过教育”, “未受过教育”, “未受过教育”, “未受过教育”, “受过教育”, “受过教育”, “受过教育”, “受过教育”, “受过教育”, “受过教育”,


df <- as.data.frame(cbind(id, wave, country, education))

数据是长格式 id 波国家 1 1 1 1... 2 2 2 2 2...

wave(a,b,c,d 等)代表不同的时间点。id (1,2) 在唯一标识符国家/地区显示人员 1 出生在英国,但这在随后的波次中不会重复,对于未在英国出生的人 2 的教育显示人员 1 未受过教育,并且此信息在整个波次中保持不变,人员 2 受过教育,并且信息在波浪中是相同的。

国家变量数据仅在第一波中收集。在其他波浪中不重复。我想通过重复第一波的数据来填充从波次 b 到 k 次的信息。

我想过使用聚结,但我不确定如何。我试过了:-

df <- df %>%  
  arrange(id, wave)  %>%  
  tidyr::fill(country, .direction ="down")

它什么也没给。请协助!

替换 缺失数据 合并

评论

0赞 Sonnie Kariuki 9/27/2023
收到了一位同事的答复。

答: 暂无答案