将字符串和数据框转换为另一个数据框-解网

问：

我有一个单行数据框，如下所示：

            Donor  Treatment Timepoint
  MK434_016   WT5 ST002_50uM       6hr

还有一个字符串，如下所示：

[1] "AAACAAGCAAACAAGAATTCGGTT-1" "AAACAAGCAAACAATCATTCGGTT-1" "AAACAAGCAAACCTGAATTCGGTT-1" "AAACAAGCAAACTTGGATTCGGTT-1"
[5] "AAACAAGCAAAGACCCATTCGGTT-1" "AAACAAGCAAAGGTAAATTCGGTT-1"

我想将两者合并以创建一个如下所示的数据框：

                           Donor  Treatment Timepoint
AAACAAGCAAACAAGAATTCGGTT-1   WT5 ST002_50uM       6hr
AAACAAGCAAACAATCATTCGGTT-1   WT5 ST002_50uM       6hr
AAACAAGCAAACCTGAATTCGGTT-1   WT5 ST002_50uM       6hr
etc...

我尝试使用 rbind（）或 paste（）以几种不同的方式合并它们，但不知道如何获得我正在寻找的完整数据帧。

R 生物信息学修拉

df2 <- cbind(df1[rep(1, length(strings)),], data.frame(barcode = strings))
df2
#             Donor  Treatment Timepoint                    barcode
# MK434_016     WT5 ST002_50uM       6hr AAACAAGCAAACAAGAATTCGGTT-1
# MK434_016.1   WT5 ST002_50uM       6hr AAACAAGCAAACAATCATTCGGTT-1
# MK434_016.2   WT5 ST002_50uM       6hr AAACAAGCAAACCTGAATTCGGTT-1
# MK434_016.3   WT5 ST002_50uM       6hr AAACAAGCAAACTTGGATTCGGTT-1
# MK434_016.4   WT5 ST002_50uM       6hr AAACAAGCAAAGACCCATTCGGTT-1
# MK434_016.5   WT5 ST002_50uM       6hr AAACAAGCAAAGGTAAATTCGGTT-1

从这里开始，如果你真的想从列中删除信息并使它们成为行名，这很简单：barcode

rownames(df2) <- df2$barcode
df2$barcode <- NULL
df2
#                            Donor  Treatment Timepoint
# AAACAAGCAAACAAGAATTCGGTT-1   WT5 ST002_50uM       6hr
# AAACAAGCAAACAATCATTCGGTT-1   WT5 ST002_50uM       6hr
# AAACAAGCAAACCTGAATTCGGTT-1   WT5 ST002_50uM       6hr
# AAACAAGCAAACTTGGATTCGGTT-1   WT5 ST002_50uM       6hr
# AAACAAGCAAAGACCCATTCGGTT-1   WT5 ST002_50uM       6hr
# AAACAAGCAAAGGTAAATTCGGTT-1   WT5 ST002_50uM       6hr

快速版本：dplyr

library(dplyr)
df1[rep(1, length(strings)),] %>%
  `rownames<-`(NULL) %>%
  mutate(barcode = strings) %>%
  tibble::column_to_rownames("barcode")
#                            Donor  Treatment Timepoint
# AAACAAGCAAACAAGAATTCGGTT-1   WT5 ST002_50uM       6hr
# AAACAAGCAAACAATCATTCGGTT-1   WT5 ST002_50uM       6hr
# AAACAAGCAAACCTGAATTCGGTT-1   WT5 ST002_50uM       6hr
# AAACAAGCAAACTTGGATTCGGTT-1   WT5 ST002_50uM       6hr
# AAACAAGCAAAGACCCATTCGGTT-1   WT5 ST002_50uM       6hr
# AAACAAGCAAAGGTAAATTCGGTT-1   WT5 ST002_50uM       6hr

数据

df1 <- structure(list(Donor = "WT5", Treatment = "ST002_50uM", Timepoint = "6hr"), class = "data.frame", row.names = "MK434_016")
strings <- c("AAACAAGCAAACAAGAATTCGGTT-1", "AAACAAGCAAACAATCATTCGGTT-1", "AAACAAGCAAACCTGAATTCGGTT-1", "AAACAAGCAAACTTGGATTCGGTT-1", "AAACAAGCAAAGACCCATTCGGTT-1", "AAACAAGCAAAGGTAAATTCGGTT-1")

library(dplyr)

df1 %>% 
  reframe(barcode = strings, across(everything()))
#>                      barcode Donor  Treatment Timepoint
#> 1 AAACAAGCAAACAAGAATTCGGTT-1   WT5 ST002_50uM       6hr
#> 2 AAACAAGCAAACAATCATTCGGTT-1   WT5 ST002_50uM       6hr
#> 3 AAACAAGCAAACCTGAATTCGGTT-1   WT5 ST002_50uM       6hr
#> 4 AAACAAGCAAACTTGGATTCGGTT-1   WT5 ST002_50uM       6hr
#> 5 AAACAAGCAAAGACCCATTCGGTT-1   WT5 ST002_50uM       6hr
#> 6 AAACAAGCAAAGGTAAATTCGGTT-1   WT5 ST002_50uM       6hr

^{创建于 2023-10-27 使用 reprex v2.0.2}

上一个：在 R 中从 python 加载 h5mu 数据以创建 seurat 对象？

下一个：sparseMatrix（i = x[[“indices”]][] + 1， p = x[[“indptr”]][]， x = x[[“data”]][]，： 'dims' 必须包含所有（i，j）对

将字符串和数据框转换为另一个数据框

Convert character string and data frame into another data frame

评论

评论