连接字符串/字符向量-解网

问：

如果我有一个字符类型的向量，我怎样才能将值连接成字符串？以下是我如何使用 paste（） 做到这一点：

sdata = c('a', 'b', 'c')
paste(sdata[1], sdata[2], sdata[3], sep ='')

屈服。"abc"

但是，当然，这只有在我提前知道数据长度的情况下才有效。

字符串 R-FAQ

答：

603赞 Matt Turner 1/20/2010 #1

尝试在粘贴函数中使用空的折叠参数：

paste(sdata, collapse = '')

感谢 http://twitter.com/onelinetips/status/7491806343

13赞 zelanix 1/20/2014

请注意，如果可以包含长度相同或长度可变的字符串，则应使用以避免意外结果。sdatapaste(sdata, sep = '', collapse = '')

51赞 Ken Williams 1/21/2010 #2

马特的回答绝对是正确的答案。但是，这是用于漫画救济目的的替代解决方案：

do.call(paste, c(as.list(sdata), sep = ""))

7赞 JD Long 1/21/2010

你真的可以在那里处理一个 apply（）语句。如果你这样做，我会投票给你;)

0赞 flying sheep 3/6/2015

如果参数不存在，这实际上是最优雅的解决方案。所以，如果你最近真的不得不做一些非常相似的事情，那就没有太多的喜剧解脱:)collapse

5赞 Patrick 11/15/2013 #3

为：sdata

gsub(", ", "", toString(sdata))

对于整数向量：

gsub(", ", "", toString(c(1:10)))

9赞 C8H10N4O2 3/19/2016

这是一个危险的答案——如果向量的元素中有逗号空间序列，这个答案将删除它们。

5赞 C8H10N4O2 3/19/2016 #4

马特·特纳（Matt Turner）的答案绝对是正确的答案。但是，本着 Ken Williams 回答的精神，您也可以这样做：

capture.output(cat(sdata, sep=""))

14赞 bartektartanus 8/17/2017 #5

您可以像这样将函数与包中的参数一起使用：stri_pastecollapsestringi

stri_paste(letters, collapse='')
## [1] "abcdefghijklmnopqrstuvwxyz"

以及一些基准测试：

require(microbenchmark)
test <- stri_rand_lipsum(100)
microbenchmark(stri_paste(test, collapse=''), paste(test,collapse=''), do.call(paste, c(as.list(test), sep="")))
Unit: microseconds
                                      expr     min       lq     mean   median       uq     max neval
           stri_paste(test, collapse = "") 137.477 139.6040 155.8157 148.5810 163.5375 226.171   100
                paste(test, collapse = "") 404.139 406.4100 446.0270 432.3250 442.9825 723.793   100
do.call(paste, c(as.list(test), sep = "")) 216.937 226.0265 251.6779 237.3945 264.8935 405.989   100

2赞 Torrien 3/21/2019

我从来没有在 R. Nice 上做过基准测试来学习新东西。

1赞 fan 5/14/2020 #6

这里有一个小的实用函数，它将命名或未命名的值列表折叠为单个字符串，以便于打印。它还将打印代码行本身。它来自我在 R 页面中的列表示例。

生成一些已命名或未命名的列表：

# Define Lists
ls_num <- list(1,2,3)
ls_str <- list('1','2','3')
ls_num_str <- list(1,2,'3')

# Named Lists
ar_st_names <- c('e1','e2','e3')
ls_num_str_named <- ls_num_str
names(ls_num_str_named) <- ar_st_names

# Add Element to Named List
ls_num_str_named$e4 <- 'this is added'

下面是一个将命名或未命名列表转换为字符串的函数：

ffi_lst2str <- function(ls_list, st_desc, bl_print=TRUE) {

  # string desc
  if(missing(st_desc)){
    st_desc <- deparse(substitute(ls_list))
  }

  # create string
  st_string_from_list = paste0(paste0(st_desc, ':'), 
                               paste(names(ls_list), ls_list, sep="=", collapse=";" ))

  if (bl_print){
    print(st_string_from_list)
  }
}

使用之前创建的列表测试函数：

> ffi_lst2str(ls_num)
[1] "ls_num:=1;=2;=3"
> ffi_lst2str(ls_str)
[1] "ls_str:=1;=2;=3"
> ffi_lst2str(ls_num_str)
[1] "ls_num_str:=1;=2;=3"
> ffi_lst2str(ls_num_str_named)
[1] "ls_num_str_named:e1=1;e2=2;e3=3;e4=this is added"

使用列表元素的子集测试函数：

> ffi_lst2str(ls_num_str_named[c('e2','e3','e4')])
[1] "ls_num_str_named[c(\"e2\", \"e3\", \"e4\")]:e2=2;e3=3;e4=this is added"
> ffi_lst2str(ls_num[2:3])
[1] "ls_num[2:3]:=2;=3"
> ffi_lst2str(ls_str[2:3])
[1] "ls_str[2:3]:=2;=3"
> ffi_lst2str(ls_num_str[2:4])
[1] "ls_num_str[2:4]:=2;=3;=NULL"
> ffi_lst2str(ls_num_str_named[c('e2','e3','e4')])
[1] "ls_num_str_named[c(\"e2\", \"e3\", \"e4\")]:e2=2;e3=3;e4=this is added"

2赞 AlexB 9/25/2020 #7

另一种方法是使用包：glue

glue_collapse(glue("{sdata}"))
paste(glue("{sdata}"), collapse = '')

8赞 LMc 10/23/2021 #8

该库有几种快速的方法可以做到这一点。stringr

str_flatten

默认情况下，将折叠没有空格的字符向量，但也有参数：collapse

str_flatten(sdata)
[1] "abc"

还有一个可选参数来代替最终分隔符。last

str_c

与参数类似，您需要指定才能实现此目的：pastecollapse

str_c(sdata, collapse = "")
[1] "abc"

str_flatten_comma

从 1.5.0 开始新增，如果您想要逗号分隔的折叠。这里的论点识别牛津逗号：stringrlast

str_flatten_comma(sdata)
[1] "a, b, c"

str_flatten_comma(sdata[1:2], last = " and ")
[1] "a and b"

基准：:p aste0

虽然这里没有明显的优势，但你可以从 R 基数使用。pastepaste0(sdata, collapse = "")

更新更长的字符串向量的基准测试在我的机器上得到了以下结果：

set.seed(4)
x <- sample(letters, 1E6, replace = T)
microbenchmark(stri_paste(x, collapse=''), 
               paste(x,collapse=''), 
               do.call(paste, c(as.list(x), sep="")),
               stringr::str_flatten(x),
               stringr::str_c(x, collapse = ""),
               paste0(x, collapse = ""))

Unit: milliseconds
                                    expr      min        lq       mean     median        uq       max neval cld
            stri_paste(x, collapse = "")  21.1788  21.80040   23.45225   22.78430   24.4271   39.1305   100 a  
                 paste(x, collapse = "") 110.7734 114.36595  126.43277  119.02755  136.5902  187.4112   100  b 
 do.call(paste, c(as.list(x), sep = "")) 538.8329 981.80345 1090.51738 1096.33470 1213.8848 1457.5622   100   c
                 stringr::str_flatten(x)  20.6276  21.60610   23.36241   22.73915   24.2210   42.3481   100 a  
        stringr::str_c(x, collapse = "")  20.9274  21.74285   23.75466   22.73950   24.3254   36.6114   100 a  
                paste0(x, collapse = "") 110.0614 112.81175  124.15555  116.96610  130.6330  168.7199   100  b

同样本着肯·威廉姆斯（Ken Williams）回答的精神：

Reduce(paste0, sdata)
[1] "abc"

上一个：将数据框字符串列拆分为多个列

下一个：在一次调用中按组对多个变量应用多个汇总函数（总和、平均值等）

连接字符串/字符向量

Concatenate a vector of strings/character

评论

评论

评论

评论

评论