Python Selenium - 查找表元素 <td> 并获取它们的值 - 但新页面加载了一秒钟,然后由于未知原因返回上一个页面
作者:José Souza 提问时间:6/3/2023
当我手动单击图像时,新页面会加载,并且新页面是稳定的。 当我在 python 中通过 selenium 单击时,新页面加载了几秒钟,然后出于未知原因自动返回上一页,因此我无法捕获新页面的元素。 第...
网页抓 问答列表
作者:José Souza 提问时间:6/3/2023
当我手动单击图像时,新页面会加载,并且新页面是稳定的。 当我在 python 中通过 selenium 单击时,新页面加载了几秒钟,然后出于未知原因自动返回上一页,因此我无法捕获新页面的元素。 第...
作者:Ashuwathama 提问时间:7/26/2022
我正在尝试学习硒,为了好玩,我决定抓取一个 Spotify 播放列表(因此我没有为此使用 spotify API),但它没有获得完整的列表,只是加载的歌曲,我尝试了滚动和等待网络中的解决方案,但似乎没...
作者:Inam Buneri 提问时间:6/8/2023
!pip install bs4 !pip install html5lib import pandas as pd !pip install lxml import requests import ...
作者:Ahmad Abdelbaset 提问时间:5/21/2023
我正在尝试抓取数据,但脚本并未加载所有 html 内容,尽管我更改了渲染时间。请看下面的代码: from requests_html import HTMLSession, AsyncHTMLSes...
作者:Louie Sui 提问时间:6/23/2023
我想删除订书钉类别下一页的链接地址,我正在努力这样做。有谁知道如何使用 css 选择器或 xpath 报废它?我正在使用 scrapy python 包。 在此处输入图像描述 我尝试使用图片中指向...
作者:PJB 提问时间:6/25/2023
我对 VBA 非常陌生,因为这是一台工作计算机,我不能使用 Selenium 之类的东西。我的宏的目的是为我的老板从基于供应商的应用程序(数据存储在我公司的服务器上)生成工作报告。我已经删除了很多代码...
作者:Bryant Irawan 提问时间:6/30/2023
为了更好的上下文,我正在抓取/解析的网址是:https://www.dreamflows.com/xlist-ca.php 我正在使用 SwiftSoup 来解析 HTML,但从文档中,我不确定这是...
作者:Kanta 提问时间:7/5/2023
这是我的第一篇文章,所以我希望我不会忘记任何事情。 因此,我试图抓取所有UFC赛事以查看战士的某些统计数据,并尝试使用Pandas。 这是我的问题开始的地方,所以当我导入网站时 import ...
作者:ИНДУС Геймдев 提问时间:7/10/2023
我需要解析一个新闻网站,新闻的标题和链接位于 <main class='single-module__Main-sc-1qdjg1k-0 iMZnZU' 中。我尝试查询子类,但无法查询。soup.pr...
作者:Rustam 提问时间:7/13/2023
对于我的项目,我需要在 Capterra 上获得企业的所有评论(应该适用于不同的企业)。我在网络抓取方面没有那么有经验,所以我很难做到这一点)。我尝试获取 Hubspot 的评论(链接到评论部分:ht...