R提取字符串匹配模式和空格前-解网

问：

我真的是 R 的新手，在尝试提取或 gsub 我想要的字符串部分时，很难理解语法的含义我的数据如下所示

d <- "Para | YTX-456 | XYZ-123456 | NTX-897"

我想提取“XYZ-123456”，所以三个特定的字母，“-”和任何后面但没有空格的数字。到目前为止，我尝试的所有内容都只是提取带有空格的数字。如何在字符串中找到“XYZ-”的匹配项并将其与后面的所有数字一起提取？

谢谢！

r 字符串匹配提取 gsub

感谢安德烈的帮助！不幸的是，这不起作用，因为我的数据比我描述的要复杂一些。我现在将更新帖子，但基本上我的字符串如下所示“Para |YTX-456型 |XYZ-123456 |NTX-897”。我只需要提取“XYZ-123456”。您的回复摘录“Para |YTX-456型 |XYZ-123456 |”

1赞 C. Murtaugh 6/23/2023

str_extract(d, 'XYZ-[:digit:]*')- 这将拉出“XYZ-”，后跟任意数量的数字。这里有一个很棒的软件包备忘单，当我使用 R 时，我几乎总是打开它。stringr

1赞 YASEM 6/23/2023

@C.Murtaugh，这是一个很好的资源，非常感谢

答：

1赞 jpsmith 6/23/2023 #1

您可以在此处使用，在所需的“XYZ-”模式之后识别所有数字：stringr::str_extract()[0-9]+

stringr::str_extract(d,"XYZ-[0-9]+")

# [1] "XYZ-123456"

R提取字符串匹配模式和空格前

R extract string matching pattern and before space

评论

评论