提问人:Nick 提问时间:1/20/2010 最后编辑:zx8754Nick 更新时间:2/16/2023 访问量:399875
连接字符串/字符向量
Concatenate a vector of strings/character
问:
如果我有一个字符类型的向量,我怎样才能将值连接成字符串?以下是我如何使用 paste() 做到这一点:
sdata = c('a', 'b', 'c')
paste(sdata[1], sdata[2], sdata[3], sep ='')
屈服。"abc"
但是,当然,这只有在我提前知道数据长度的情况下才有效。
答:
尝试在粘贴函数中使用空的折叠参数:
paste(sdata, collapse = '')
感谢 http://twitter.com/onelinetips/status/7491806343
评论
sdata
paste(sdata, sep = '', collapse = '')
马特的回答绝对是正确的答案。但是,这是用于漫画救济目的的替代解决方案:
do.call(paste, c(as.list(sdata), sep = ""))
评论
collapse
为:sdata
gsub(", ", "", toString(sdata))
对于整数向量:
gsub(", ", "", toString(c(1:10)))
评论
马特·特纳(Matt Turner)的答案绝对是正确的答案。但是,本着 Ken Williams 回答的精神,您也可以这样做:
capture.output(cat(sdata, sep=""))
您可以像这样将函数与包中的参数一起使用:stri_paste
collapse
stringi
stri_paste(letters, collapse='')
## [1] "abcdefghijklmnopqrstuvwxyz"
以及一些基准测试:
require(microbenchmark)
test <- stri_rand_lipsum(100)
microbenchmark(stri_paste(test, collapse=''), paste(test,collapse=''), do.call(paste, c(as.list(test), sep="")))
Unit: microseconds
expr min lq mean median uq max neval
stri_paste(test, collapse = "") 137.477 139.6040 155.8157 148.5810 163.5375 226.171 100
paste(test, collapse = "") 404.139 406.4100 446.0270 432.3250 442.9825 723.793 100
do.call(paste, c(as.list(test), sep = "")) 216.937 226.0265 251.6779 237.3945 264.8935 405.989 100
评论
这里有一个小的实用函数,它将命名或未命名的值列表折叠为单个字符串,以便于打印。它还将打印代码行本身。它来自我在 R 页面中的列表示例。
生成一些已命名或未命名的列表:
# Define Lists
ls_num <- list(1,2,3)
ls_str <- list('1','2','3')
ls_num_str <- list(1,2,'3')
# Named Lists
ar_st_names <- c('e1','e2','e3')
ls_num_str_named <- ls_num_str
names(ls_num_str_named) <- ar_st_names
# Add Element to Named List
ls_num_str_named$e4 <- 'this is added'
下面是一个将命名或未命名列表转换为字符串的函数:
ffi_lst2str <- function(ls_list, st_desc, bl_print=TRUE) {
# string desc
if(missing(st_desc)){
st_desc <- deparse(substitute(ls_list))
}
# create string
st_string_from_list = paste0(paste0(st_desc, ':'),
paste(names(ls_list), ls_list, sep="=", collapse=";" ))
if (bl_print){
print(st_string_from_list)
}
}
使用之前创建的列表测试函数:
> ffi_lst2str(ls_num)
[1] "ls_num:=1;=2;=3"
> ffi_lst2str(ls_str)
[1] "ls_str:=1;=2;=3"
> ffi_lst2str(ls_num_str)
[1] "ls_num_str:=1;=2;=3"
> ffi_lst2str(ls_num_str_named)
[1] "ls_num_str_named:e1=1;e2=2;e3=3;e4=this is added"
使用列表元素的子集测试函数:
> ffi_lst2str(ls_num_str_named[c('e2','e3','e4')])
[1] "ls_num_str_named[c(\"e2\", \"e3\", \"e4\")]:e2=2;e3=3;e4=this is added"
> ffi_lst2str(ls_num[2:3])
[1] "ls_num[2:3]:=2;=3"
> ffi_lst2str(ls_str[2:3])
[1] "ls_str[2:3]:=2;=3"
> ffi_lst2str(ls_num_str[2:4])
[1] "ls_num_str[2:4]:=2;=3;=NULL"
> ffi_lst2str(ls_num_str_named[c('e2','e3','e4')])
[1] "ls_num_str_named[c(\"e2\", \"e3\", \"e4\")]:e2=2;e3=3;e4=this is added"
另一种方法是使用包:glue
glue_collapse(glue("{sdata}"))
paste(glue("{sdata}"), collapse = '')
该库有几种快速的方法可以做到这一点。stringr
str_flatten
默认情况下,将折叠没有空格的字符向量,但也有参数:collapse
str_flatten(sdata)
[1] "abc"
还有一个可选参数来代替最终分隔符。last
str_c
与参数类似,您需要指定才能实现此目的:paste
collapse
str_c(sdata, collapse = "")
[1] "abc"
str_flatten_comma
从 1.5.0 开始新增,如果您想要逗号分隔的折叠。这里的论点识别牛津逗号:stringr
last
str_flatten_comma(sdata)
[1] "a, b, c"
str_flatten_comma(sdata[1:2], last = " and ")
[1] "a and b"
基准::p aste0
虽然这里没有明显的优势,但你可以从 R 基数使用。paste
paste0(sdata, collapse = "")
更新更长的字符串向量的基准测试在我的机器上得到了以下结果:
set.seed(4)
x <- sample(letters, 1E6, replace = T)
microbenchmark(stri_paste(x, collapse=''),
paste(x,collapse=''),
do.call(paste, c(as.list(x), sep="")),
stringr::str_flatten(x),
stringr::str_c(x, collapse = ""),
paste0(x, collapse = ""))
Unit: milliseconds
expr min lq mean median uq max neval cld
stri_paste(x, collapse = "") 21.1788 21.80040 23.45225 22.78430 24.4271 39.1305 100 a
paste(x, collapse = "") 110.7734 114.36595 126.43277 119.02755 136.5902 187.4112 100 b
do.call(paste, c(as.list(x), sep = "")) 538.8329 981.80345 1090.51738 1096.33470 1213.8848 1457.5622 100 c
stringr::str_flatten(x) 20.6276 21.60610 23.36241 22.73915 24.2210 42.3481 100 a
stringr::str_c(x, collapse = "") 20.9274 21.74285 23.75466 22.73950 24.3254 36.6114 100 a
paste0(x, collapse = "") 110.0614 112.81175 124.15555 116.96610 130.6330 168.7199 100 b
同样本着肯·威廉姆斯(Ken Williams)回答的精神:
Reduce(paste0, sdata)
[1] "abc"
评论