提问人:Sir Ksilem 提问时间:5/11/2011 更新时间:5/11/2011 访问量:56932
删除具有 nan 值的行
remove row with nan value
问:
例如,假设我有以下数据:
data <- c(1,2,3,4,5,6,NaN,5,9,NaN,23,9)
attr(data,"dim") <- c(6,2)
data
[,1] [,2]
[1,] 1 NaN
[2,] 2 5
[3,] 3 9
[4,] 4 NaN
[5,] 5 23
[6,] 6 9
现在我想删除其中包含 NaN 值的行:第 1 行和第 4 行。 但是我不知道这些行在哪里,如果它是 100.000+ 行的数据集,所以我需要用函数找到它们并删除完整的行。
谁能给我指出正确的方向?
答:
49赞
Andrie
5/11/2011
#1
该函数将告诉您需要的行在哪里:complete.cases
data <- matrix(c(1,2,3,4,5,6,NaN,5,9,NaN,23,9), ncol=2)
data[complete.cases(data), ]
[,1] [,2]
[1,] 2 5
[2,] 3 9
[3,] 5 23
[4,] 6 9
8赞
Wojciech Sobala
5/11/2011
#2
数据
data <- matrix(rnorm(100000000), ncol=10000)
idx <- sample(1:10000,100)
idy <- sample(1:10000,100)
data[idx,idy] <- NaN
功能
foo <- function(d=data) d[apply(d,2,function(x) any(is.nan(x))),]
运行时
> system.time(data[complete.cases(data),])
user system elapsed
3.53 0.12 3.65
> system.time(foo(data))
user system elapsed
2.37 0.09 2.46
评论
1赞
MeloMCR
9/9/2015
这不应该是吗?(使用“1”代替“2”作为维度,并使用“!”仅获得没有NaN的线?d[!apply(d,1,function(x) any(is.nan(x))), ]
评论