抓取 问答列表

公文。DocumentNode.QuerySelectorAll 不会重新运行任何内容

作者:Flisp 提问时间:10/13/2023

我尝试访问以下主页上的“div.prod_inner”(见图)以进行网络抓取。 我使用 HtmlAgilityPack,代码在另一个主页上工作,也返回一个元素。"div.lay_main" 这是我使...

 解析(抓取)时代替数字

作者:NETkuz 提问时间:10/15/2023

下午好。 尝试分析类似的页面时 https://www.dongchedi.com/usedcar/12441930 页面代码显示的不是价格数字  项目图片 <p class="jsx-11...

Javascript 循环对每个元素重复查询

作者:DrPaulVella 提问时间:10/16/2023

我有一个网站,其中包含多个同名的类元素。 如果我运行 var z = document.getElementsByClassName('DivContainerV2'); 我得到 69 个元素 ...

为什么 Xpath 在 Selenium 中没有产生正确数量的元素?

作者:Shah Zeb 提问时间:10/22/2023

我正在尝试使用 Selenium 和 Xpath 从网站上抓取数据,但我遇到了一个奇怪的问题。 网站链接:dexcheck 预期成果: 当我查看该页面时,我希望 Xpath 产生 16 个“已实现...

使用 selenium 访问嵌套在多个元素中的 div

作者:Diana 提问时间:10/26/2023

我正在尝试使用 python 中的 selenium 库自动执行 Web 交互(我是初学者)。这是我希望代码自动按下的按钮的一些html代码: <div class="MuiButtonBase-r...

是否有适用于 R 的 Undetected Chromedriver(或类似版本)?

作者:mjshanno 提问时间:10/19/2023

是否有任何版本的 R 版未检测到的 Chromedriver?或者有没有一个包可以帮助我在 R 中为主动阻止抓取的网站进行网络抓取? 我四处搜索,在互联网上找不到任何东西。...

我无法通过 Selenium Python 单击“Crear”按钮

作者:Bruno Franco Sentis 提问时间:10/18/2023

我尝试使用ActionChain,搜索阴影,框架,但什么都没有。 driver.get(Url) time.sleep(5) # Wait wait = WebDriverWait(driver,...

找到带有 selenium 的下拉元素

作者:Sushma Vishnoi 提问时间:10/14/2023

我正在尝试找到一个下拉元素,但下拉列表位于 div 类中,并且下拉值不存在索引选择或 id。我已经粘贴了下面的图片。需要一些帮助来解决这个问题。...

如何根据现有 URL 从 HTML 元素中抓取数据?

作者:T6VK 提问时间:10/28/2023

我有一个脚本可以将RSS数据保存到电子表格中,但它仍然有缺点和问题。 我收到了标题、时间、文章链接形式的数据。 https://i.stack.imgur.com/9YTAF.png 我希望脚本能...

Python 脚本在 Google Colab 上运行,但不在本地运行

作者:luizgsm 提问时间:10/27/2023

我试图在 VS Code pyhton 笔记本中运行此脚本并收到该错误。 import requests import xmltodict xml = requests.get('https://w...


共195条 当前第3页