提问人:Leonhard Geisler 提问时间:1/7/2022 更新时间:1/7/2022 访问量:38
将缺失的变量 ID 插补到时间序列面板中
Impute missing variable id's into a time series panel
问:
为了进行一些时间序列分析,我想使用如下所示的数据帧:
data <- data.frame (Store_ID = as.character(c(seq( 1, length.out = 10),
seq( 1, length.out = 9),
c(1,2,3,4,6,7,8,9))),
amount_sold = c(seq( 1, 9, length.out = 27)),
date = c(rep(as.Date("2015-01-01"),10),
rep(as.Date("2015-01-02"),9),
rep(as.Date("2015-01-03"),8)
)
)
如您所见,第一次约会(2015-01-01)有 10 个Store_ID,但下一个日期只有 9 个,最后一个日期只有 8 个。
为了我的分析,我需要添加接下来两天缺少的Store_ID。因此,我希望有 30 行和一个“0”作为缺失Store_ID的amount_sold。
答:
2赞
Jose Victor Zambrana
1/7/2022
#1
尝试
library(tidyr)
data <- data.frame (Store_ID = as.character(c(seq( 1, length.out = 10),
seq( 1, length.out = 9),
c(1,2,3,4,6,7,8,9))),
amount_sold = c(seq( 1, 9, length.out = 27)),
date = c(rep(as.Date("2015-01-01"),10),
rep(as.Date("2015-01-02"),9),
rep(as.Date("2015-01-03"),8)
)
) %>%
complete(Store_ID, date, fill = list(amount_sold = 0))
评论
1赞
Leonhard Geisler
1/7/2022
感谢您的简单解决方案!
评论