web-scraping知识经验-解网

作者：Fariz Awi 提问时间：11/14/2023

请查看此网站。我的目标是检索给定 URL 的页面中所有 PDF 链接的屏幕截图。首先，我尝试请求 URL 并解析 HTML 文本并找到所有 PDF 链接： from bs4 import Bea...

作者：Skanda Vyas 提问时间：11/16/2023

我一直在尝试从使用 iCIMS 运行的网站中抓取数据，但是每当我尝试使用非常基本的 CSS 选择器或 XPATHS 时，程序都无法找到它。这是我的代码： import time driver = ...

作者：Yamar Lyons 提问时间：11/16/2023

我正在为我的大学期末考试做一个 Expedia 网络抓取项目。我一直在努力使用我的代码，在日历上选择实际日期，它打开日历并循环播放。我知道这与我无法与咏叹调标签交互有关，而且我很确定这与日历在网格系统...

作者：iffishells 提问时间：11/16/2023

由于自信，我无法分享整个想法，但我会尽力为您提供您可以理解和帮助我的全貌。有些链接是我们自动下载的类型，这些 url 的扩展名是 .docs 例如，此链接。当我在 linux ubuntu 等本地...

作者：Fashola John 提问时间：11/15/2023

我在使用 Playwright 运行异步代码时遇到了一个。您能帮助我了解此错误的根本原因并提出可能的解决方案吗？NotImplementedError 这是我运行的代码：html = await g...

作者：motylas 提问时间：11/13/2023

我正在使用 selenium，但我无法从标记为 flex 的 DIV 中获取数据 https://www.jpg.store/collection/hungrycowsbymuesliswap?tab...

作者：Saint-malo 提问时间：11/9/2023

我正在尝试通过结构为“https://www.facebook.com/media_name/videos”的 URL 从 Facebook 上的各种媒体中抓取视频。该过程涉及滚动浏览包含很长视频列表...

作者：João Paiva 提问时间：11/12/2023

我不得不从一个名为Unicorn Auctions的拍卖网站上删除数据。当我尝试使用 rvest 执行此操作时，我能得到的只是拍卖标题和 URL，但我还需要它的开始和结束日期。当我尝试找到它的CS...

作者：TER 提问时间：11/16/2023

我正在尝试从这个网站上抓取招聘信息： https://external-maximus.icims.com/jobs/search?ss=1&hashed=-435771476&mobile=fal...

作者：Muhammad Nabeel 提问时间：11/14/2023

我正在用硒抓取网站，抓取的结果大约是 7-10 秒，但是我还需要使用旋转代理以避免被禁止，所以我必须使用带有硒线的旋转代理，但抓取时间增加到 40-50 秒，这很多，我该如何解决这个问题？ from...