BeautifulSoup 无法识别 <main class= 之后的子类
作者:ИНДУС Геймдев 提问时间:7/10/2023
我需要解析一个新闻网站,新闻的标题和链接位于 <main class='single-module__Main-sc-1qdjg1k-0 iMZnZU' 中。我尝试查询子类,但无法查询。soup.pr...
取 问答列表
作者:ИНДУС Геймдев 提问时间:7/10/2023
我需要解析一个新闻网站,新闻的标题和链接位于 <main class='single-module__Main-sc-1qdjg1k-0 iMZnZU' 中。我尝试查询子类,但无法查询。soup.pr...
作者:jarodas2004 提问时间:7/11/2023
是否可以在第二次出现下划线('_')后在 PowerShell 中提取字符串的部分? 输入: XXXXXX_YYYYYYYYYY_AAAAAA WWWWWWWWWW_XXXXX_BBB 所需...
作者:Rustam 提问时间:7/13/2023
对于我的项目,我需要在 Capterra 上获得企业的所有评论(应该适用于不同的企业)。我在网络抓取方面没有那么有经验,所以我很难做到这一点)。我尝试获取 Hubspot 的评论(链接到评论部分:ht...
作者:Hassan Suriya 提问时间:7/18/2023
现在我有这个 python 代码: from selenium import webdriver from selenium.webdriver.chrome.options import Opti...
作者:TCritical 提问时间:7/20/2023
我一直在尝试使用代码单击网页中的选项卡 Set P = D.FindElementByCss("a[href='#pro-content-pro']") P.Click 如果选项卡在网页中可见...
作者:daniel gi 提问时间:7/18/2023
我正在尝试抓取(无头)此 URL 的脚本,但我注意到每当我在本地机器上执行此操作时,我都会得到:脚本。"https://vidstat.taboola.com/lite-unit/4.1.0/Unit...
作者:user22250523 提问时间:7/19/2023
这个问题在这里已经有答案了: open() 给出 FileNotFoundError / IOError: '[Errno 2] No such file or directory' (11 个答案)...
作者:Serge Rogatch 提问时间:10/1/2021
我需要逐行读取文件,并且无法轻松更改它。大致如下:readline() with open(file_name, 'r') as i_file: while True: line = i_fil...
作者:anpami 提问时间:7/22/2023
我想使用 cURL 在 PHP 中抓取这个网站。 我在PHP中使用类似的网络抓取脚本,它们运行良好。 但是,我收到以下错误: Fatal error: Uncaught ValueError: ...
作者:James Rider 提问时间:7/25/2023
https://www.nber.org/papers?page=1&perPage=50&sortBy=public_date 以上网页由一系列学术论文组成。这些论文的标题(例如,分组异质性下的稀...