问答列表

BeautifulSoup 无法识别 <main class= 之后的子类

作者:ИНДУС Геймдев 提问时间:7/10/2023

我需要解析一个新闻网站,新闻的标题和链接位于 <main class='single-module__Main-sc-1qdjg1k-0 iMZnZU' 中。我尝试查询子类,但无法查询。soup.pr...

修剪/拆分字符串

作者:jarodas2004 提问时间:7/11/2023

是否可以在第二次出现下划线('_')后在 PowerShell 中提取字符串的部分? 输入: XXXXXX_YYYYYYYYYY_AAAAAA WWWWWWWWWW_XXXXX_BBB 所需...

使用“加载更多”/“显示更多”按钮解析网站

作者:Rustam 提问时间:7/13/2023

对于我的项目,我需要在 Capterra 上获得企业的所有评论(应该适用于不同的企业)。我在网络抓取方面没有那么有经验,所以我很难做到这一点)。我尝试获取 Hubspot 的评论(链接到评论部分:ht...

TypeError:__init__() 使用 Selenium 和 BeautifulSoup4 提取 Google 趋势博客文章标题时出现意外的关键字参数“options”错误

作者:Hassan Suriya 提问时间:7/18/2023

现在我有这个 python 代码: from selenium import webdriver from selenium.webdriver.chrome.options import Opti...

单击“网页”选项卡(如果可见)

作者:TCritical 提问时间:7/20/2023

我一直在尝试使用代码单击网页中的选项卡 Set P = D.FindElementByCss("a[href='#pro-content-pro']") P.Click 如果选项卡在网页中可见...

Puppeteer 始终在远程服务器上加载移动脚本

作者:daniel gi 提问时间:7/18/2023

我正在尝试抓取(无头)此 URL 的脚本,但我注意到每当我在本地机器上执行此操作时,我都会得到:脚本。"https://vidstat.taboola.com/lite-unit/4.1.0/Unit...

Python FileNotFoundError [错误 2] [重复]

作者:user22250523 提问时间:7/19/2023

这个问题在这里已经有答案了: open() 给出 FileNotFoundError / IOError: '[Errno 2] No such file or directory' (11 个答案)...

在 Python 中使用 readline() 读取文件时如何检测 EOF?

作者:Serge Rogatch 提问时间:10/1/2021

我需要逐行读取文件,并且无法轻松更改它。大致如下:readline() with open(file_name, 'r') as i_file: while True: line = i_fil...

致命错误:未捕获的 ValueError:DOMDocument::loadHTML():参数 #1 ($source) 不得为空

作者:anpami 提问时间:7/22/2023

我想使用 cURL 在 PHP 中抓取这个网站。 我在PHP中使用类似的网络抓取脚本,它们运行良好。 但是,我收到以下错误: Fatal error: Uncaught ValueError: ...

Web 抓取 R 中的超链接文本?

作者:James Rider 提问时间:7/25/2023

https://www.nber.org/papers?page=1&perPage=50&sortBy=public_date 以上网页由一系列学术论文组成。这些论文的标题(例如,分组异质性下的稀...


共489条 当前第26页