html 解析 问答列表

如何使用 Beautifulsoup 解析来自同一类的信息?

作者:stochastic learner 提问时间:4/21/2022

假设我有以下 HTML html_doc = """ <html> <head> <title>Page Title</title> </head> <body> <div cla...

jsoup 可以使用 localStorage 值吗?

作者:Ivan Fomkin 提问时间:4/22/2022

我正在尝试解析一个网站(例如谷歌) 在Chrome本地存储中,我看到了变量(键值对) 文档内容取决于此变量 我可以使用 jsoup 设置它吗? 或者我应该使用其他工具?...

BeautifulSoup findAll() 给定多个类?

作者:sebo 提问时间:9/11/2013

我想从网站上抓取项目列表,并保留它们的显示顺序。这些项目在表中组织,但它们可以是两个不同类之一(按随机顺序)。 有没有办法提供多个类并让 BeautifulSoup4 找到任何给定类中的所有项目? ...

Xpath 按类名和单元格填充查找 html 元素

作者:James 提问时间:5/16/2022

如何找到带有 和 的元素?我尝试了以下方法:,但这不起作用。tbodyclass="centered"cellpadding="4""//tbody[contains(@class='borderco...

Python - Beautifulsoup - 解析多个跨度元素

作者:JJH 提问时间:10/7/2022

我正在尝试从“span”中提取标题。 以下面的代码为例,我正在寻找的输出是 6536 和 9319,它们是“title”的一部分。如下图所示: span aria-label=“6536 个用户为...

403 使用 Jsoup 解析 Web 内容时出现 Web 解析错误

作者:MvmGsu 提问时间:8/30/2022

我有一个任务来解析网站的内容,并将其存储在本地驱动器的 .fsv 文件中。我正在使用 Jsoup 来阅读网页的内容,这就是我的程序的样子。出于某种原因,在 Java 中,我得到了 403 Forbid...

C# Unity - 如何解析 Steam 新闻页面以提取 IMG URL?从 Get Resquest 收到的数据似乎不完整。是XHTML吗?

作者:Katerlad 提问时间:9/8/2022

问题: 我在尝试解析此页面以查找包含图像链接的外壳 xml 标记时遇到问题。 https://store.steampowered.com/feeds/news/app/1348750/?cc=U...

用于从公司注册处解析 XML 的指针

作者:Carl Gilbert 提问时间:3/5/2023

我正在使用 Companies House API 获取公共持有的帐户,以确定公司的员工人数。我不确定如何解析 XML 以找到我正在寻找的值,并希望得到一些帮助。 通过Companies House...

删除 &lt;br /&gt; 标记,这些标记是 &lt;ul&gt; 标记的不需要/无效的子项

作者:PTTW 提问时间:8/27/2022

如何从标签之间删除这些标签?<br /><ul> <p>Paragraph 1 <br /> Break line</p> <ul> <br /> <li> New Line</li> <br ...

如何递归解析 HTML 元素

作者:Sai 提问时间:10/7/2022

我有下面的HTML,需要递归解析。为此,我正在使用 Jericho html 解析器库。但是无法实现递归。感谢指点! [HTML全 <div wicket:id="Container1"> <d...


共257条 当前第6页