html 解析 问答列表

HTML 解析和 Dom 树构造

作者:Thelostcause 提问时间:2/28/2021

所以我一直在努力了解浏览器是如何工作的,这让我头晕目眩。我读过几篇关于它的文章,但所有这些文章都不像它应该的那样清楚。 任何人都可以帮我详细了解浏览器的工作原理。 这是我到现在为止的理解: 考虑这...

使用 GetElementsByClass 按类名查找嵌套在 <p> 元素中的所有 <div> 元素

作者:RagAnt 提问时间:10/25/2022

我正在使用 Kotlin 中的 Jsoup 创建一个解析器 我需要获取一个标签的内部文本,该标签的类为“ptrack-content”,类为“titleCard-synopsis” 当我尝试在由以...

如何在从控制器返回视图之前替换 html 标签文本,如标签或 h1 文本?

作者:Noor Uddin 提问时间:11/14/2022

我正在开发 ASP MVC .NET 6 应用程序。应用程序的默认语言是英语。现在,我们要求在管理面板中实现不同的语言选项,如西班牙语、阿拉伯语等。我们将为每个屏幕/视图设置一个 JSON 文件,其中...

无法从 VBA 捕获具有 HTML 对象的网页内容

作者:Phil Anki 提问时间:11/10/2022

我使用这个 URL https://www.morningstar.com/stocks/xtks/1407/dividends,并且带有即将到来的股息的表格显示在我的浏览器上 我检查页面并尝试捕捉表...

抓取同级标签并关联为父子关系

作者:Arcade 提问时间:11/5/2022

我想使用 PHP 从两个不同的标签中提取内容。我想将 h2 标签与紧随其后的 div 标签的内容相关联——就像父子关系一样。 <h1>Title 1</h1> <div class="items">...

仅从 SEC 10-k 文件(HTML 文件)中提取可见文本

作者:YPG 提问时间:11/4/2022

我已经使用该软件包从 SEC 的 EDGAR 系统下载了 10-k 文件。对于每个申请,基础 html 代码都存储在单独的文本文件中。现在,我只想从 html 代码中提取原始 html 文件的读者可见...

如何将特定 div 从网页导出到 dataframe?

作者:CaptainG 提问时间:10/31/2022

我想从网页中导出一个特定的div。在这种情况下,我想导出 id 为“producer-votes-wrapper”的 div;页面的这一部分包含我想要获取的所有数字(数据)。 使用前面的例子和问题,...

如何在有/没有废弃网页的情况下读取 div 详细信息,这在 java 源代码中不存在?

作者:Ashish Bhoya 提问时间:10/30/2022

我有一个用例,我想在边缘商店中读取已发布扩展的版本。 任何已发布扩展的链接如下 -> https://microsoftedge.microsoft.com/addons/detail/incogni...

正则表达式 - 如何从图像中获取 src 和 alt

作者:Jessika 提问时间:10/21/2022

我需要从所有图像中获取 html 代码的 src 和 alt。我设法得到了它,但我有以下问题: 如果图像没有alt,则它不会检测到我的图像。在这些情况下,我只需要获取 src。 以下代码适用于以下...

文档为空 ( lxml.etree.ParserError: 文档为空 )

作者:Shehan Jayalath 提问时间:10/8/2021

此错误的原因可能是什么? 我认为这是由于相关网页的页面加载不完整。这是对的吗? Traceback (most recent call last): File "/home/ubuntu/.lo...


共257条 当前第4页