R 函数解析 strsplit 中返回错误“下标越界”-解网

问：

我正在使用 R 提取一列 HTML 页面的域名。为此，我创建了一个函数“域”。它似乎工作正常，直到它到达以“mailto：[email protected]”形式出现的页面。这些显然是电子邮件的链接。我仍然想将它们合并到我的数据集中，但我得到的错误是：“strsplit（gsub（”http://|https://|www\.“， ”“， x）， ”/“）[[c（1， 1）]] ：下标越界”

如何修改此代码以绕过“mailto”页面？

这是我的职能

domain <- function(x) strsplit(gsub("http://|https://|www\\.","", x),"/")[[c(1,1)]]

这是我的命令

mainpagelevel3$url <- sapply(mainpagelevel3$url, domain)

我在一组不包含“mailto：”页面的 url 上运行了这段代码，它工作得很好，所以我认为这一定是它卡住的地方。我不介意它是否导致“[email protected]”或保持原样。

r html 解析

R 函数解析 strsplit 中返回错误“下标越界”

R function to parse returning error in strsplit "subscript out of bounds"

评论