html 解析知识经验-第8页-解网

作者：Bray 提问时间：7/23/2023

我是一个完全的新手。但是我想从html中检索文本。我已经检查了我的应用程序元素，并拥有我想要的类 ID。我需要在 Java 脚本中插入什么来解析 html 代码并检索“rbc-toolbar-la...

作者：Rustam 提问时间：7/13/2023

对于我的项目，我需要在 Capterra 上获得企业的所有评论（应该适用于不同的企业）。我在网络抓取方面没有那么有经验，所以我很难做到这一点）。我尝试获取 Hubspot 的评论（链接到评论部分：ht...

作者：Koray Usta 提问时间：7/2/2023

cmd 屏幕我正在使用 Microsoft Windows 11 专业版。我的 python 版本是：3.11.4，我的 pip 版本是：23.1.2 我已经使用 cmd 下载了 beauti...

作者：Олександр Митровка 提问时间：6/26/2023

我不明白如何调用回调来解析子类别。我以下一个代码为例。我想按 kegoria 解析类别，例如：主类别--->sub_category--->如果子类别有类别，请解析并添加链接，直到我们遇到具...

作者：A_7097 提问时间：6/26/2023

我有一个完整的 html 页面，我需要使用 ckeditor 5 进行编辑，但它删除了 html 文件中提供的所有类和样式。如何禁用这些过滤器： allowedContent： true 不起作用。 ...

作者：Seyedmahdi moosavyan 提问时间：6/12/2023

我正在尝试抓取一个波斯语网页，我想从包含 3 个标签的 ul 中获得 6 个 li 标签。我的问题是每个 li 都有嵌套的 li 标签，当我使用 soup.find_all（'li'）时，它会找到所...

作者：sanchay vashist 提问时间：5/25/2023

尝试从文本中抓取图像，但无法使用 Beutiful soup 访问 div 块，有什么解决方案吗？我也尝试过使用硒，但它仍然不起作用。该网站正在使用 sava 脚本动态加载图像，我认为这是一个问题...

作者：30ThreeDegrees 提问时间：5/28/2023

我一直在学习如何使用 Pandas 抓取网页，但我遇到了一些障碍，我无法提取其内部的特定数据。这是 Pandas 正在解析的 html： <tr data-country="Bulgaria">...

作者：s0ull788 提问时间：5/28/2023

我正在练习抓取并选择了一个站点 https://www.amalgama-lab.com/songs/m/marilyn_manson/tainted_love.html 当我尝试获取对该站点的获取请...

作者：Cappucher 提问时间：5/21/2023

我正在尝试创建一个程序来分析 SEC 10K 报告并将它们放入可读的文本文件中。到目前为止，我已经成功地从他们的 API （sec-api）获取了 HTML 并在本地下载了它（如果有更好的方法来获取...