网页抓知识经验-第9页-解网

作者：José Souza 提问时间：6/3/2023

当我手动单击图像时，新页面会加载，并且新页面是稳定的。当我在 python 中通过 selenium 单击时，新页面加载了几秒钟，然后出于未知原因自动返回上一页，因此我无法捕获新页面的元素。第...

作者：Ashuwathama 提问时间：7/26/2022

我正在尝试学习硒，为了好玩，我决定抓取一个 Spotify 播放列表（因此我没有为此使用 spotify API），但它没有获得完整的列表，只是加载的歌曲，我尝试了滚动和等待网络中的解决方案，但似乎没...

作者：Inam Buneri 提问时间：6/8/2023

!pip install bs4 !pip install html5lib import pandas as pd !pip install lxml import requests import ...

作者：Ahmad Abdelbaset 提问时间：5/21/2023

我正在尝试抓取数据，但脚本并未加载所有 html 内容，尽管我更改了渲染时间。请看下面的代码： from requests_html import HTMLSession, AsyncHTMLSes...

作者：Louie Sui 提问时间：6/23/2023

我想删除订书钉类别下一页的链接地址，我正在努力这样做。有谁知道如何使用 css 选择器或 xpath 报废它？我正在使用 scrapy python 包。在此处输入图像描述我尝试使用图片中指向...

作者：PJB 提问时间：6/25/2023

我对 VBA 非常陌生，因为这是一台工作计算机，我不能使用 Selenium 之类的东西。我的宏的目的是为我的老板从基于供应商的应用程序（数据存储在我公司的服务器上）生成工作报告。我已经删除了很多代码...

作者：Bryant Irawan 提问时间：6/30/2023

为了更好的上下文，我正在抓取/解析的网址是：https://www.dreamflows.com/xlist-ca.php 我正在使用 SwiftSoup 来解析 HTML，但从文档中，我不确定这是...

作者：Kanta 提问时间：7/5/2023

这是我的第一篇文章，所以我希望我不会忘记任何事情。因此，我试图抓取所有UFC赛事以查看战士的某些统计数据，并尝试使用Pandas。这是我的问题开始的地方，所以当我导入网站时 import ...

作者：ИНДУС Геймдев 提问时间：7/10/2023

我需要解析一个新闻网站，新闻的标题和链接位于 <main class='single-module__Main-sc-1qdjg1k-0 iMZnZU' 中。我尝试查询子类，但无法查询。soup.pr...

作者：Rustam 提问时间：7/13/2023

对于我的项目，我需要在 Capterra 上获得企业的所有评论（应该适用于不同的企业）。我在网络抓取方面没有那么有经验，所以我很难做到这一点）。我尝试获取 Hubspot 的评论（链接到评论部分：ht...