网页抓 问答列表

是否有适用于 R 的 Undetected Chromedriver(或类似版本)?

作者:mjshanno 提问时间:10/19/2023

是否有任何版本的 R 版未检测到的 Chromedriver?或者有没有一个包可以帮助我在 R 中为主动阻止抓取的网站进行网络抓取? 我四处搜索,在互联网上找不到任何东西。...

为什么 Xpath 在 Selenium 中没有产生正确数量的元素?

作者:Shah Zeb 提问时间:10/22/2023

我正在尝试使用 Selenium 和 Xpath 从网站上抓取数据,但我遇到了一个奇怪的问题。 网站链接:dexcheck 预期成果: 当我查看该页面时,我希望 Xpath 产生 16 个“已实现...

是否可以下载页面的一部分 html 代码,以便以后使用 python 抓取它?

作者:Programmer0403 提问时间:10/25/2023

我正在创建一个 python 网页抓取项目,我从这个网站返回任何初级网球运动员的排名数据:网站 底部有一个选择器,您可以在其中选择每页看到多少人。如果您选择 100,将有 100 页的排名(1000...

使用 selenium 访问嵌套在多个元素中的 div

作者:Diana 提问时间:10/26/2023

我正在尝试使用 python 中的 selenium 库自动执行 Web 交互(我是初学者)。这是我希望代码自动按下的按钮的一些html代码: <div class="MuiButtonBase-r...

Python 脚本在 Google Colab 上运行,但不在本地运行

作者:luizgsm 提问时间:10/27/2023

我试图在 VS Code pyhton 笔记本中运行此脚本并收到该错误。 import requests import xmltodict xml = requests.get('https://w...

如何根据现有 URL 从 HTML 元素中抓取数据?

作者:T6VK 提问时间:10/28/2023

我有一个脚本可以将RSS数据保存到电子表格中,但它仍然有缺点和问题。 我收到了标题、时间、文章链接形式的数据。 https://i.stack.imgur.com/9YTAF.png 我希望脚本能...

我尝试了各种元素搜索方法,如 class、name 和 id,但它不起作用

作者:Peter Yun 提问时间:10/29/2023

我一直在尝试使用 WinHTTP 进行 Excel Web 抓取,并且尝试了各种元素搜索方法,例如 class、name 和 id,但它不起作用。抓取在其他网站上有效,但在此网站上效果不佳。我想抓取的...

尝试运行代码时收到“ModuleNotFoundError:没有名为'distutils'的模块”

作者:collatz 提问时间:10/28/2023

我在本地 Mac 上制作了一个 Selenium 机器人,它在那里完美运行。尝试通过 google cloud 在虚拟 Windows 10 计算机上运行它时,我收到以下错误: "Traceback...

VBA - 网页定价抓取工具,创建URL循环

作者:SparkyVBA 提问时间:10/30/2023

我希望有人可以帮助像我这样的初学者。 我正在尝试创建一个网络爬虫,该爬虫从 B 列中的 URL 中获取定价。 我想创建一个循环,以便将 HTML 中的价格从“B”列中的 URL 提取到“C”列。 由...

无法使用 bs4 和 re 定位 html 标签

作者:Howard Zhu 提问时间:11/16/2023

我正在尝试使用 BS4 来取消收入发布的公开文件,有一个名为“reconciliation(s)”的关键字,所以我尝试使用 Regex 进行搜索。我发现所有的 reconciliation 关键字都应...


共174条 当前第5页