使用 Rselenium 进行网络抓取太难了:JSphantom 解释?

Webscraping with Rselenium is so difficult : JSphantom explanation?

提问人:laurent_grouet 提问时间:11/16/2023 最后编辑:halferlaurent_grouet 更新时间:11/21/2023 访问量:70

问:

我一直在尝试使用 Rselenium,重新安装了 Java,从 chromedriver 中删除了许可证,获得了适当版本的 Chrome,安装了 nextstats,将键盘切换到英语,但无论我做什么,我都无法打开 Firefox 或 Chrome。这是我的代码

rs_driver_object<-rsDriver( browser = "chrome" , chromever = "114.0.5735.90" ,   verbose=F, port = free_port())

rD <- rsDriver(browser = "firefox", port = free_port())

我总是收到这种类型的消息错误

httr 调用中未定义错误。httr 输出:2240 毫秒后无法连接到 localhost 端口 14415:无法连接到服务器

但这些行不会发送错误消息:

pJS <- wdman::phantomjs(port = port) remDrPJS <- remoteDriver(browserName = "phantomjs", port = port) remDrPJS$open()

问题:似乎什么也没发生!如何继续使用 phantomjs?(假设它真的有效)

我想强调一个事实,当你处理 Rselenium 时,很难理解在不同的解决方案路径(wdman 包、使用 Docker,...)中发生了什么。Rselenium给我的印象是它只适用于计算机专家。

更新

当我键入命令时

selenium(chromever = "114.0.5735.90", retcommand = T)我得到:

[1] "C:\\PROGRA~1\\AZULJA~1\\jdk\\ZULU87~1.392\\bin\\java.exe -Dwebdriver.chrome.driver=\"C:\\Users\\grouetl\\AppData\\Local\\binman\\binman_chromedriver\\win32\\114.0.5735.90/chromedriver.exe\" character(0) -Dphantomjs.binary.path=\"C:\\Users\\grouetl\\AppData\\Local\\binman\\binman_phantomjs\\windows\\2.1.1/phantomjs-2.1.1-windows/bin/phantomjs.exe\" -jar \"C:\\Users\\grouetl\\AppData\\Local\\binman\\binman_seleniumserver\\generic\\4.0.0-alpha-2/selenium-server-standalone-4.0.0-alpha-2.jar\" -port 4567" –

这让我认为 Java 和 Selenium 服务器没问题。

Docker PhantomJS 系列

评论


答: 暂无答案