html 解析 问答列表

解析 HTML 并以 JSON 形式从元素中检索文本

作者:Bray 提问时间:7/23/2023

我是一个完全的新手。但是我想从html中检索文本。我已经检查了我的应用程序元素,并拥有我想要的类 ID。 我需要在 Java 脚本中插入什么来解析 html 代码并检索“rbc-toolbar-la...

使用“加载更多”/“显示更多”按钮解析网站

作者:Rustam 提问时间:7/13/2023

对于我的项目,我需要在 Capterra 上获得企业的所有评论(应该适用于不同的企业)。我在网络抓取方面没有那么有经验,所以我很难做到这一点)。我尝试获取 Hubspot 的评论(链接到评论部分:ht...

Python (BeautfiulSoup4):ModuleNotFoundError:没有名为“bs4”的模块错误

作者:Koray Usta 提问时间:7/2/2023

cmd 屏幕 我正在使用 Microsoft Windows 11 专业版。 我的 python 版本是:3.11.4,我的 pip 版本是:23.1.2 我已经使用 cmd 下载了 beauti...

如何使用 Scrapy 报废类别和子类别

作者:Олександр Митровка 提问时间:6/26/2023

我不明白如何调用回调来解析子类别。 我以下一个代码为例。 我想按 kegoria 解析类别,例如: 主类别--->sub_category--->如果子类别有类别,请解析并添加链接,直到我们遇到具...

将 html 渲染到 ckEditor5 中不会读取它的内联 css 并且 allowedContent 选项不起作用?

作者:A_7097 提问时间:6/26/2023

我有一个完整的 html 页面,我需要使用 ckeditor 5 进行编辑,但它删除了 html 文件中提供的所有类和样式。如何禁用这些过滤器: allowedContent: true 不起作用。 ...

Python:如何在 BeautifulSoup4 中获取 li 标签列表

作者:Seyedmahdi moosavyan 提问时间:6/12/2023

我正在尝试抓取一个波斯语网页,我想从包含 3 个标签的 ul 中获得 6 个 li 标签。我的问题是每个 li 都有嵌套的 li 标签,当我使用 soup.find_all('li') 时,它会找到所...

Web scrapping Dermnet 图像

作者:sanchay vashist 提问时间:5/25/2023

尝试从文本中抓取图像,但无法使用 Beutiful soup 访问 div 块,有什么解决方案吗? 我也尝试过使用硒,但它仍然不起作用。该网站正在使用 sava 脚本动态加载图像,我认为这是一个问题...

如何使用 pandas 解析 html 表数据的特定部分

作者:30ThreeDegrees 提问时间:5/28/2023

我一直在学习如何使用 Pandas 抓取网页,但我遇到了一些障碍,我无法提取其内部的特定数据。 这是 Pandas 正在解析的 html: <tr data-country="Bulgaria">...

如何修复SSLError(SSLError(1, '[SSL: WRONG_SIGNATURE_TYPE] 错误的签名类型 (_ssl.c:1002)')))

作者:s0ull788 提问时间:5/28/2023

我正在练习抓取并选择了一个站点 https://www.amalgama-lab.com/songs/m/marilyn_manson/tainted_love.html 当我尝试获取对该站点的获取请...

如何解析 SEC 10K 文档中的 HTML 表格数据并以文本格式编写?

作者:Cappucher 提问时间:5/21/2023

我正在尝试创建一个程序来分析 SEC 10K 报告并将它们放入可读的文本文件中。到目前为止,我已经成功地从他们的 API (sec-api) 获取了 HTML 并在本地下载了它(如果有更好的方法来获取...


共257条 当前第8页