如何使用 dplyr 管道删除所有列均为零的行-解网

问：

我有以下数据框：

dat <- structure(list(`A-XXX` = c(1.51653275922944, 0.077037240321129, 
0), `fBM-XXX` = c(2.22875185527511, 0, 0), `P-XXX` = c(1.73356698481106, 
0, 0), `vBM-XXX` = c(3.00397859609183, 0, 0)), .Names = c("A-XXX", 
"fBM-XXX", "P-XXX", "vBM-XXX"), row.names = c("BATF::JUN_AHR", 
"BATF::JUN_CCR9", "BATF::JUN_IL10"), class = "data.frame")

dat 
#>                     A-XXX  fBM-XXX    P-XXX  vBM-XXX
#> BATF::JUN_AHR  1.51653276 2.228752 1.733567 3.003979
#> BATF::JUN_CCR9 0.07703724 0.000000 0.000000 0.000000
#> BATF::JUN_IL10 0.00000000 0.000000 0.000000 0.000000

我可以使用以下命令删除包含所有列零的行：

> dat <- dat[ rowSums(dat)!=0, ]
> dat
                    A-XXX  fBM-XXX    P-XXX  vBM-XXX
BATF::JUN_AHR  1.51653276 2.228752 1.733567 3.003979
BATF::JUN_CCR9 0.07703724 0.000000 0.000000 0.000000

但是我怎样才能用 dplyr 的管道风格做到这一点呢？

r dplyr tidyverse

dat <- structure(list(`A-XXX` = c(1.51653275922944, 0.077037240321129, 
                                  0), `fBM-XXX` = c(2.22875185527511, 0, 0), `P-XXX` = c(1.73356698481106, 
                                                                                         0, 0), `vBM-XXX` = c(3.00397859609183, 0, 0)), .Names = c("A-XXX", 
                                                                                                                                                   "fBM-XXX", "P-XXX", "vBM-XXX"), row.names = c("BATF::JUN_AHR", 
                                                                                                                                                                                                 "BATF::JUN_CCR9", "BATF::JUN_IL10"), class = "data.frame")

library(tidyverse)
dat %>%
  rownames_to_column() %>%
  bind_cols(all_zero = pmap_lgl(., function(rowname, ...) all(list(...) == 0))) %>%
  filter(all_zero == FALSE) %>%
  `rownames<-`(.$rowname) %>%
  select(-rowname, -all_zero)
#>                     A-XXX  fBM-XXX    P-XXX  vBM-XXX
#> BATF::JUN_AHR  1.51653276 2.228752 1.733567 3.003979
#> BATF::JUN_CCR9 0.07703724 0.000000 0.000000 0.000000

由 reprex 软件包（v0.2.0）于 2018-03-14 创建。

1赞 mgrund 10/23/2020 #4

这是使用 dplyr 的逐行运算的另一个选项（定义三个示例列，计算按行总和）：col1,col2,col3

library(tidyverse)

df <- df %>% 
    rowwise() %>% 
    filter(sum(c(col1,col2,col3)) != 0)

或者，如果您有大量变量（列）可供选择，您也可以通过以下方式使用 tidyverse 选择语法：

df <- df %>% 
    rowwise() %>% 
    filter(sum(c_across(col1:col3)) != 0)

有关详细信息，请参阅：https://dplyr.tidyverse.org/articles/rowwise.html

4赞 Agile Bean 1/7/2021 #5

更新 2022-11-11

使用最新的 tidyverse 软件包，.现在更新的解决方案是：across() in filter() is deprecated

data %>% filter(if_all(everything(.), ~. != 0))

旧解决方案（已终止）

通过@mgrund补充答案， DPLYR 1.0.0 的较短替代方案是：

# Option A:
data %>% filter(across(everything(.)) != 0))

# Option B:
data %>% filter(across(everything(.), ~. != 0))

说明：
检查每个tidy_select变量，该变量表示每一列。在选项 A 中，如果每列不为零，则检查每一列，这加起来就是每列中一整行零。在选项 B 中，对每一列都应用公式（~），用于检查当前列是否为零。across()everything()

编辑：
由于已经按行检查，因此您不需要.这与或不同。filterrowwise()selectmutate

重要提示：
在选项 A 中，关键是要写，
而不是！across(everything(.)) != 0across(everything(.) != 0))

原因：
需要一个 tidyselect 变量（这里），而不是布尔值（这将是acrosseverything()everything(.) != 0))

library(dplyr)
library(tibble)
dat <- structure(list(`A-XXX` = c(1.51653275922944, 0.077037240321129, 
                                  0), `fBM-XXX` = c(2.22875185527511, 0, 0), `P-XXX` = c(1.73356698481106, 
                                                                                         0, 0), `vBM-XXX` = c(3.00397859609183, 0, 0)), .Names = c("A-XXX", 
                                                                                                                                                   "fBM-XXX", "P-XXX", "vBM-XXX"), row.names = c("BATF::JUN_AHR", 
                                                                                                                                                                                                 "BATF::JUN_CCR9", "BATF::JUN_IL10"), class = "data.frame")
dat
#>                     A-XXX  fBM-XXX    P-XXX  vBM-XXX
#> BATF::JUN_AHR  1.51653276 2.228752 1.733567 3.003979
#> BATF::JUN_CCR9 0.07703724 0.000000 0.000000 0.000000
#> BATF::JUN_IL10 0.00000000 0.000000 0.000000 0.000000

dat %>% 
  rownames_to_column("ID") %>% 
  filter(if_any(!matches("ID"), ~ . != 0)) %>% 
  column_to_rownames("ID")
#>                     A-XXX  fBM-XXX    P-XXX  vBM-XXX
#> BATF::JUN_AHR  1.51653276 2.228752 1.733567 3.003979
#> BATF::JUN_CCR9 0.07703724 0.000000 0.000000 0.000000

^{创建于 2021-04-12 由 reprex 软件包（v1.0.0）}

上一个：如何将 NA 替换为一组值

下一个：如何使用 dplyr 管道根据向量对数据框的行进行排序

如何使用 dplyr 管道删除所有列均为零的行

How to remove rows where all columns are zero using dplyr pipe

评论

评论

评论

更新 2022-11-11

旧解决方案（已终止）

评论