检索分页后面的元素屏幕截图
作者:Fariz Awi 提问时间:11/14/2023
请查看此网站。我的目标是检索给定 URL 的页面中所有 PDF 链接的屏幕截图。 首先,我尝试请求 URL 并解析 HTML 文本并找到所有 PDF 链接: from bs4 import Bea...
web-scraping 问答列表
作者:Fariz Awi 提问时间:11/14/2023
请查看此网站。我的目标是检索给定 URL 的页面中所有 PDF 链接的屏幕截图。 首先,我尝试请求 URL 并解析 HTML 文本并找到所有 PDF 链接: from bs4 import Bea...
作者:Skanda Vyas 提问时间:11/16/2023
我一直在尝试从使用 iCIMS 运行的网站中抓取数据,但是每当我尝试使用非常基本的 CSS 选择器或 XPATHS 时,程序都无法找到它。 这是我的代码: import time driver = ...
作者:Yamar Lyons 提问时间:11/16/2023
我正在为我的大学期末考试做一个 Expedia 网络抓取项目。我一直在努力使用我的代码,在日历上选择实际日期,它打开日历并循环播放。我知道这与我无法与咏叹调标签交互有关,而且我很确定这与日历在网格系统...
作者:iffishells 提问时间:11/16/2023
由于自信,我无法分享整个想法,但我会尽力为您提供您可以理解和帮助我的全貌。 有些链接是我们自动下载的类型,这些 url 的扩展名是 .docs 例如,此链接。 当我在 linux ubuntu 等本地...
作者:Fashola John 提问时间:11/15/2023
我在使用 Playwright 运行异步代码时遇到了一个。您能帮助我了解此错误的根本原因并提出可能的解决方案吗?NotImplementedError 这是我运行的代码:html = await g...
作者:motylas 提问时间:11/13/2023
我正在使用 selenium,但我无法从标记为 flex 的 DIV 中获取数据 https://www.jpg.store/collection/hungrycowsbymuesliswap?tab...
作者:Saint-malo 提问时间:11/9/2023
我正在尝试通过结构为“https://www.facebook.com/media_name/videos”的 URL 从 Facebook 上的各种媒体中抓取视频。该过程涉及滚动浏览包含很长视频列表...
作者:João Paiva 提问时间:11/12/2023
我不得不从一个名为Unicorn Auctions的拍卖网站上删除数据。 当我尝试使用 rvest 执行此操作时,我能得到的只是拍卖标题和 URL,但我还需要它的开始和结束日期。当我尝试找到它的CS...
作者:TER 提问时间:11/16/2023
我正在尝试从这个网站上抓取招聘信息: https://external-maximus.icims.com/jobs/search?ss=1&hashed=-435771476&mobile=fal...
作者:Muhammad Nabeel 提问时间:11/14/2023
我正在用硒抓取网站,抓取的结果大约是 7-10 秒,但是我还需要使用旋转代理以避免被禁止,所以我必须使用带有硒线的旋转代理,但抓取时间增加到 40-50 秒,这很多,我该如何解决这个问题? from...