使用正则表达式将字符行拆分为列-解网

问：

我有一个单列数据集，其中每一行都是不同长度的串联字符串。我正在尝试使用正则表达式将每行拆分为 3 列。数据集的示例如下所示。

第 1 列（ID）将是字母数字的初始字符串。这始终是相同的长度（在本例中为 24 个字符）

第 2 列（类型）将是中间位。这可能在长度和字符类型（与号、空格、斜杠、逗号，但绝不会因数字）而异

第 3 列（数字）将是字符串-最终数字序列，其长度也是固定的（在本例中为 14）。

c23uij49753dfd3273shdjsh /Animals/Birds/Cardinal 0.873289139232
91873nc9248jfe08jsdif894 /Animals/Mammals/Felines/Tigers 0.989734823872
38939137fhjnffnf73nxlppa /Transportation/Automobiles & Vehicles/Ford-Explorer 0.983947399348

data <- data.frame(
  string=c("c23uij49753dfd3273shdjsh /Animals/Birds/Cardinal 0.873289139232", 
          "91873nc9248jfe08jsdif894 /Animals/Mammals/Felines/Tigers 0.989734823872", 
           "38939137fhjnffnf73nxlppa /Transportation/Automobiles & Vehicles/Ford-Explorer  0.983947399348"))

我一直在尝试使用 extract（），但无法获得针对中间部分的正则表达式。像下面这样的东西在正确的轨道上，但不能让我到达那里。

output <- extract(data, string, into=c('ID', "Type", "Numerical"), "(.{24)([a-zA-Z]*)(.{14})

R 正则表达式拆分

使用正则表达式将字符行拆分为列

Splitting character row into columns using Regex

评论