网页抓 问答列表

Python Selenium - 查找表元素 <td> 并获取它们的值 - 但新页面加载了一秒钟,然后由于未知原因返回上一个页面

作者:José Souza 提问时间:6/3/2023

当我手动单击图像时,新页面会加载,并且新页面是稳定的。 当我在 python 中通过 selenium 单击时,新页面加载了几秒钟,然后出于未知原因自动返回上一页,因此我无法捕获新页面的元素。 第...

试图抓取一个 Spotify 播放列表,但它只得到前 20 个结果中的 100 个结果

作者:Ashuwathama 提问时间:7/26/2022

我正在尝试学习硒,为了好玩,我决定抓取一个 Spotify 播放列表(因此我没有为此使用 spotify API),但它没有获得完整的列表,只是加载的歌曲,我尝试了滚动和等待网络中的解决方案,但似乎没...

“module”对象在 Python 中不可调用

作者:Inam Buneri 提问时间:6/8/2023

!pip install bs4 !pip install html5lib import pandas as pd !pip install lxml import requests import ...

为什么“requests-html”不能呈现所有 HTML 内容?

作者:Ahmad Abdelbaset 提问时间:5/21/2023

我正在尝试抓取数据,但脚本并未加载所有 html 内容,尽管我更改了渲染时间。请看下面的代码: from requests_html import HTMLSession, AsyncHTMLSes...

如何使用CSS选择器或XPath抓取隐藏的Web链接地址

作者:Louie Sui 提问时间:6/23/2023

我想删除订书钉类别下一页的链接地址,我正在努力这样做。有谁知道如何使用 css 选择器或 xpath 报废它?我正在使用 scrapy python 包。 在此处输入图像描述 我尝试使用图片中指向...

VBA Web Scraper For 循环从 Excel 列 C 输入数据,给出运行时错误“438”:对象不支持此属性或方法

作者:PJB 提问时间:6/25/2023

我对 VBA 非常陌生,因为这是一台工作计算机,我不能使用 Selenium 之类的东西。我的宏的目的是为我的老板从基于供应商的应用程序(数据存储在我公司的服务器上)生成工作报告。我已经删除了很多代码...

SwiftSoup 能够正确解析这一点吗?

作者:Bryant Irawan 提问时间:6/30/2023

为了更好的上下文,我正在抓取/解析的网址是:https://www.dreamflows.com/xlist-ca.php 我正在使用 SwiftSoup 来解析 HTML,但从文档中,我不确定这是...

Panda 未打印所有表格

作者:Kanta 提问时间:7/5/2023

这是我的第一篇文章,所以我希望我不会忘记任何事情。 因此,我试图抓取所有UFC赛事以查看战士的某些统计数据,并尝试使用Pandas。 这是我的问题开始的地方,所以当我导入网站时 import ...

BeautifulSoup 无法识别 <main class= 之后的子类

作者:ИНДУС Геймдев 提问时间:7/10/2023

我需要解析一个新闻网站,新闻的标题和链接位于 <main class='single-module__Main-sc-1qdjg1k-0 iMZnZU' 中。我尝试查询子类,但无法查询。soup.pr...

使用“加载更多”/“显示更多”按钮解析网站

作者:Rustam 提问时间:7/13/2023

对于我的项目,我需要在 Capterra 上获得企业的所有评论(应该适用于不同的企业)。我在网络抓取方面没有那么有经验,所以我很难做到这一点)。我尝试获取 Hubspot 的评论(链接到评论部分:ht...


共174条 当前第9页