提问人:rajvijay 提问时间:4/10/2016 更新时间:7/17/2021 访问量:13218
R dplyr:: 使用字符串变量重命名和选择
R dplyr:: rename and select using string variable
问:
我正在尝试在我的数据帧中选择变量的子集,并重命名新数据帧中的变量。我有大量变量需要重命名。我正在使用
dplyr::select
dplyr::select_
由于我有许多变量要重命名,我正在考虑是否应该使用字符串变量来重命名,但不确定是否可行?使用字符串可以帮助我管理 newname oldname 映射。下面是一个示例
dplyr::select
library(dplyr)
library(nycflights13)
set.seed(123)
data <- sample_n(flights, 3)
select(data,yr=year,mon=month,deptime=dep_time)
问题是我如何在字符串中传递参数,即 newvariable=oldvariable 参数,然后使用
dplyr::select_
col_vector <- c("year", "month", "dep_time")
select_(data, .dots = col_vector)
我想到的字符串是:
rename_vector <- c("yr=year","mon=month","deptime=dep_time")
任何建议都会非常有帮助。
答:
9赞
Michael Veale
4/10/2016
#1
您可以将列表传递给 in ,而不是使用向量,其中名称是新列名称,旧名称是字符。.dots
dplyr::select_
> rename_list <- list(sepal_length = "Sepal.Length", sepal_width = "Sepal.Width")
> iris %>% tbl_df %>% select_(.dots = rename_list)
Source: local data frame [150 x 2]
sepal_length sepal_width
(dbl) (dbl)
1 5.1 3.5
2 4.9 3.0
3 4.7 3.2
4 4.6 3.1
5 5.0 3.6
6 5.4 3.9
7 4.6 3.4
8 5.0 3.4
9 4.4 2.9
10 4.9 3.1
.. ... ...
15赞
mpalanco
4/11/2017
#2
德普莱尔
另一个选项与传递具有新列名的向量结合使用:dplyr
setNames
iris %>%
select(Sepal.Length, Sepal.Width) %>%
setNames(c("sepal_length","sepal_width"))
基础包
setNames(iris[, c("Sepal.Length", "Sepal.Width")],
c("sepal_length", "sepal_width"))
数据表
library(data.table)
setnames(iris, old = c("Sepal.Length", "Sepal.Width"), new = c("sepal_length","sepal_width"))
2赞
climatestudent
7/17/2021
#3
使用你可以做这样的事情:rename_with
old = c("Sepal.Length", "Sepal.Width")
new = c("sepal_length", "sepal_width")
iris %>%
dplyr::select(all_of(old)) %>%
dplyr::rename_with(~ new, all_of(old))
评论
colnames(data) <- col_vector
col_vector
names(mtcars)[c(1, 2, 3)] <- c('z', 'y', 'z')
names(mtcars)[names(mtcars) %in% c('x', 'y', 'z')] <- c('mpg', 'cyl', 'disp')