提问人:Eternity Tomorrow 提问时间:1/25/2020 更新时间:1/28/2020 访问量:441
Selenium aspx 结果
Selenium aspx results
问:
我是硒的新手,所以如果问题没有很好地形成,我深表歉意。 我正在考虑自动化一些数据收集。有一个 ASP.NET 站点,您可以在其中请求有关特定主题的数据。数据查询完成后,网页将使用结果进行更新。当我使用硒来获取page_source时,我看不到数据。我相信它是在__VIEWSTATE中编码的。使用 IE DOM 资源管理器,数据以纯文本形式存在。
有没有办法从 DOM 资源管理器中提取数据?基本上,我很乐意得到一个转储并自己解析它。
任何帮助将不胜感激。
答:
0赞
Eternity Tomorrow
1/28/2020
#1
我想我想通了。感谢您的所有输入。我从中得到了答案:通过 Selenium 抓取动态内容?
我最终做的是首先获取页面上的 iframe 列表
driver.find_elements_by_tag_name("iframe")
然后一次切换到每个 iframe。就我而言,第一个 iframe 是具有相关信息的 iframe:
driver.switch_to.frame(driver.find_elements_by_tag_name("iframe")[0])
一旦我进入相关框架,我就可以做:
html = driver.page_source
这将给我带来预期的结果。
框架上下文似乎很重要。一旦你进入框架上下文,你就可以抓取数据。
评论
<input type="hidden">
<input>
driver.page_source