html 解析 问答列表

如何使用htmlunit记录渲染页面期间触发的所有请求?

作者:defalt1996 提问时间:4/23/2023

我正在使用 HTMLUnit 尝试记录加载本地 html 文件时触发的所有请求。 这是下面的测试文件: <script type="text/javascript"> !(function () ...

从字符串中的所有 &lt;a&gt; 标签中获取文本

作者:zuk1 提问时间:2/27/2009

由于我在正则表达式上完全没用,而且这在过去半个小时里一直困扰着我,我想我会在这里发布这个,因为它可能很简单。 <a href="/folder/files/hey/">hey.exe</a> <a ...

AngleSharp 解析 - 表和重复的标签/值数据名称

作者:sam 提问时间:5/2/2023

<tr><td class='separator' style="background-color:#000000;" colspan = '2'></td></tr> <tr><td colspa...

AngleSharp HtmlParser 插入空跨度

作者:DelyaHF 提问时间:5/10/2023

c# 中的库 AngleSharp.HtmlParser 插入空范围 输入 html: <div style="font-size: 16pt; font-weight: bold;">Загол...

Android、Java、通过 Jsoup 从 Web 表单下拉列表中获取数据

作者:Vicente Leon 提问时间:5/13/2023

使用 Android Studio 和 Java,我几乎尝试了我在 StackOverflow 上找到的所有关于它的所有方法,但没有任何效果,我不知道如何从 Web 中的下拉列表中提取值: (http...

当正则表达式模式与字符串中的任何位置不匹配时该怎么办?

作者:Salman 提问时间:11/20/2010

我正在尝试使用这种模式匹配类型字段:<input>hidden /<input type="hidden" name="([^"]*?)" value="([^"]*?)" />/ 以下是一些示...

如何使用 BeautifulSoup 从网页中抓取特定 URL?

作者:Outdoor_Cat 提问时间:5/19/2023

我正在编写一个 Python 脚本,用于解析 HTML(一个分类网站)并向我发送有关特定产品和价格点的电子邮件通知。除了“listing_url”捕获之外,一切都在这里工作,我希望在电子邮件中显示它,...

如何解析 SEC 10K 文档中的 HTML 表格数据并以文本格式编写?

作者:Cappucher 提问时间:5/21/2023

我正在尝试创建一个程序来分析 SEC 10K 报告并将它们放入可读的文本文件中。到目前为止,我已经成功地从他们的 API (sec-api) 获取了 HTML 并在本地下载了它(如果有更好的方法来获取...

Web scrapping Dermnet 图像

作者:sanchay vashist 提问时间:5/25/2023

尝试从文本中抓取图像,但无法使用 Beutiful soup 访问 div 块,有什么解决方案吗? 我也尝试过使用硒,但它仍然不起作用。该网站正在使用 sava 脚本动态加载图像,我认为这是一个问题...

如何使用 pandas 解析 html 表数据的特定部分

作者:30ThreeDegrees 提问时间:5/28/2023

我一直在学习如何使用 Pandas 抓取网页,但我遇到了一些障碍,我无法提取其内部的特定数据。 这是 Pandas 正在解析的 html: <tr data-country="Bulgaria">...


共257条 当前第23页