BeautifulSoup 无法识别 <main class= 之后的子类
作者:ИНДУС Геймдев 提问时间:7/10/2023
我需要解析一个新闻网站,新闻的标题和链接位于 <main class='single-module__Main-sc-1qdjg1k-0 iMZnZU' 中。我尝试查询子类,但无法查询。soup.pr...
网页 问答列表
作者:ИНДУС Геймдев 提问时间:7/10/2023
我需要解析一个新闻网站,新闻的标题和链接位于 <main class='single-module__Main-sc-1qdjg1k-0 iMZnZU' 中。我尝试查询子类,但无法查询。soup.pr...
作者:Rustam 提问时间:7/13/2023
对于我的项目,我需要在 Capterra 上获得企业的所有评论(应该适用于不同的企业)。我在网络抓取方面没有那么有经验,所以我很难做到这一点)。我尝试获取 Hubspot 的评论(链接到评论部分:ht...
作者:Hassan Suriya 提问时间:7/18/2023
现在我有这个 python 代码: from selenium import webdriver from selenium.webdriver.chrome.options import Opti...
作者:TCritical 提问时间:7/20/2023
我一直在尝试使用代码单击网页中的选项卡 Set P = D.FindElementByCss("a[href='#pro-content-pro']") P.Click 如果选项卡在网页中可见...
作者:anpami 提问时间:7/22/2023
我想使用 cURL 在 PHP 中抓取这个网站。 我在PHP中使用类似的网络抓取脚本,它们运行良好。 但是,我收到以下错误: Fatal error: Uncaught ValueError: ...
作者:James Rider 提问时间:7/25/2023
https://www.nber.org/papers?page=1&perPage=50&sortBy=public_date 以上网页由一系列学术论文组成。这些论文的标题(例如,分组异质性下的稀...
作者:Vinh Nguyễn Thành 提问时间:7/27/2023
我正在 Python 上进行以下链接活动(这是关于 Python Web Access 数据 - Coursera 的作业)。问题来了: 在本作业中,您将编写一个扩展 http://www.py4e....
作者:user_bktv_all3103 提问时间:7/30/2023
我需要在更改页面后获取页面的源代码,我向页面发送请求,然后页面在我的浏览器中打开,我用手选择一些数据,然后出现一个包含必要数据的表格,经过所有这些操作后,我该如何获取此表格或更改后获取整页代码 im...
作者:Krystian Owczarek 提问时间:8/3/2023
我有一个服务器,在使用 Puppeteer 发送 POST 请求后,我打开一个页面,向下滚动到底部,然后才返回页面的 HTML 代码。我在这里的目标是发送图像的所有 URL,因为它们以无限滚动的方式加...
作者:TCritical 提问时间:8/4/2023
我想从以下 HTML 代码中提取表格内容,这些代码列在 <div 类下。我尝试了不同的代码,但找不到正确的解决方案。 <table class="ISLogIn AvgTotal" id="invo...