使用 HTMLUNIT 对动态网页进行爬网-解网

问：

我正在使用HtmlUnit从动态网页抓取数据，该网页使用无限滚动来动态获取数据，就像Facebook的新闻源一样。我用下面的句子来模拟向下滚动事件：

webclient.setJavaScriptEnabled(true);
webclient.setAjaxController(new NicelyResynchronizingAjaxController());
ScriptResult sr=myHtmlPage.executeJavaScript("window.scrollBy(0,600)");
webclient.waitForBackgroundJavaScript(10000);
myHtmlPage=(HtmlPage)sr.getNewPage();

但是myHtmlPage似乎与前一个相同，即myHtmlPage中没有附加新数据，因此我只能抓取网页上的前几个数据。感谢您的帮助！

javascript ajax 网络爬虫 htmlunit 无限滚动

使用 HTMLUNIT 对动态网页进行爬网

crawl dynamic web page using htmlunit

评论