将缺失的变量 ID 插补到时间序列面板中

Impute missing variable id's into a time series panel

提问人:Leonhard Geisler 提问时间:1/7/2022 更新时间:1/7/2022 访问量:38

问:

为了进行一些时间序列分析,我想使用如下所示的数据帧:

data <- data.frame (Store_ID = as.character(c(seq( 1, length.out = 10),
                                              seq( 1, length.out = 9),
                                              c(1,2,3,4,6,7,8,9))),
                    amount_sold = c(seq( 1, 9, length.out = 27)),
                    date = c(rep(as.Date("2015-01-01"),10),
                             rep(as.Date("2015-01-02"),9),
                             rep(as.Date("2015-01-03"),8)
                             )
                            )

如您所见,第一次约会(2015-01-01)有 10 个Store_ID,但下一个日期只有 9 个,最后一个日期只有 8 个。

为了我的分析,我需要添加接下来两天缺少的Store_ID。因此,我希望有 30 行和一个“0”作为缺失Store_ID的amount_sold。

R 时间序列 操作 缺失数据 数据整理

评论


答:

2赞 Jose Victor Zambrana 1/7/2022 #1

尝试

library(tidyr)

data <- data.frame (Store_ID = as.character(c(seq( 1, length.out = 10),
                                          seq( 1, length.out = 9),
                                          c(1,2,3,4,6,7,8,9))),
                amount_sold = c(seq( 1, 9, length.out = 27)),
                date = c(rep(as.Date("2015-01-01"),10),
                         rep(as.Date("2015-01-02"),9),
                         rep(as.Date("2015-01-03"),8)
                )
) %>%
  complete(Store_ID, date, fill = list(amount_sold = 0)) 

评论

1赞 Leonhard Geisler 1/7/2022
感谢您的简单解决方案!