网页 问答列表

WebDriver.Wait() 在用于无限页面滚动的 While 循环中不起作用

作者:Waqas Ahmed 提问时间:8/7/2023

我想在 while 循环中使用函数。While loop 用于滚动无限滚动网站。我想在last_scroll和new_scroll之间等待一下,以加载页面内容。静态工作正常,但我不想使用它。WebDr...

代理和 Python 请求库不会更改 IP

作者:Roylat Gnail 提问时间:8/8/2023

我正在尝试通过抓取来存档站点(API 不是一种选择),并且正在使用代理绕过站点的速率限制。 我正在使用 python 请求库,并使用存储在 中的代理列表,其中包含工作代理proxies.txt 我...

为什么我的 Selenium 抓取工具为不同的查询返回相同的图像源?

作者:Jeff_V 提问时间:8/8/2023

我在 Express 服务器上设置了以下 Google 图片抓取工具。它接受一个查询数组,并应该返回每个查询的第一个图像结果值的数组,即每个查询的单独 Google 图片搜索。src let que...

如何使用漂亮的汤对桌子的可折叠/可扩展部分进行网络抓取

作者:Mulak 提问时间:8/9/2023

我正在从雅虎财经的损益表数据表中收集数据。此表中有可折叠/可展开的部分,网络爬虫似乎无法访问这些部分。如何从折叠的部分中检索数据?这是我从中抓取的网站的链接:https://finance.yahoo...

在 XML parser.feed(text) xml.etree.ElementTree.ParseError 中:格式不正确(标记无效):第 1 行,第 0 列

作者:Yasser Mohamed 提问时间:8/9/2023

这段代码我在 Ping AI 中测试过并有效,但在我的 Vstudio 中不起作用 import urllib.request import urllib.parse import urllib.e...

是否有网站禁用广告拦截的 API 以及它们自己?

作者:Alex 提问时间:8/12/2023

我正在使用 Chrome 115 中的 Ad Block Plus 扩展程序,从开发人员的角度来看,有些事情引起了我的注意。 在 https://satellites.pro/ 上,我得到了一个弹出...

如何使用 selenium 从 webelement 中提取文本

作者:amspsingh04 提问时间:8/12/2023

在这里,我尝试访问 leetcode 问题标题,这些标题可在给定的链接中找到。但是,我似乎无法访问指定 Web 元素中的文本。我得到的错误说: AttributeError: 'list' obje...

无法使用 Selenium 获取元素

作者:hanna 提问时间:8/14/2023

我无法从网站获得评级编号 https://www.hoka.com/en/us/mens-everyday-running-shoes/rincon-3/1119395.html 使用硒。 这是我所...

使用 Python 从 URL 中提取数据

作者:codedbyjosh 提问时间:8/19/2023

我正在尝试使用 Python 和 BeautifulSoup 从网站中提取数据。我需要的数据在表格中。 我知道如何使用 .但是,此页上有多个具有相同类名的表。通过id选择表的代码是什么。soup.s...

从网页中提取数据时出错

作者:HSHO 提问时间:8/27/2023

我制定了以下代码来从提供的网页中检索数据:https://www.redfin.com/NV/Fallon/630-Serpa-Pl-89406/unit-Fallon/home/178255574?...


共212条 当前第12页