html 解析 问答列表

BeautifulSoup findAll() 给定多个类?

作者:sebo 提问时间:9/11/2013

我想从网站上抓取项目列表,并保留它们的显示顺序。这些项目在表中组织,但它们可以是两个不同类之一(按随机顺序)。 有没有办法提供多个类并让 BeautifulSoup4 找到任何给定类中的所有项目? ...

Xpath 按类名和单元格填充查找 html 元素

作者:James 提问时间:5/16/2022

如何找到带有 和 的元素?我尝试了以下方法:,但这不起作用。tbodyclass="centered"cellpadding="4""//tbody[contains(@class='borderco...

如何在 PHP 中解析和处理 HTML/XML?

作者: 提问时间:8/27/2010

如何解析 HTML/XML 并从中提取信息?...

LIBXML_NOBLANKS到底是做什么的?

作者:hanshenrik 提问时间:9/15/2020

两者之间有什么区别 $domd=new DOMDocument(); $domd->loadHTML($html, LIBXML_NOBLANKS); 和 $domd=new DOMDocum...

如何使用 Nokogiri 捕获同级标签之间的连续元素?

作者:rosswgray 提问时间:5/31/2022

我有类似以下 HTML 的东西,它代表了多项选择题。模式通常是标签(问题),然后是 和 和 四个 s(答案选项)。但是,只是偶尔,一个问题会超过一个标签。<p><ol><li><p> <ol /> ...

将 .prn 文件解析为 html

作者:Vijay 提问时间:6/9/2022

我正在尝试将 .prn 文件转换为 html。但是由于文件格式的原因,我无法以我想要的方式进行解析。 我尝试了很多方法。其中一些是: package main; import java.io.Bu...

捕捉样式标签内部内容

作者:WP-Silver 提问时间:6/16/2022

我使用以下正则表达式来捕获所有样式 HTML 标签和内部内容: <style[^>]*>([^<]+)?<[\s\/]+style> 这很好用,它会捕获所有内容,直到结束样式标签,但如果标签内容...

正则表达式,用于在 HTML 标记的重复模式中创建不同的捕获组

作者:Austin Becker 提问时间:7/12/2022

我想在每次出现这些 HTML 标签时制作一个带有文本的捕获组。<li></li> 例如: <li>packaged in a classy box</li> <li>measures 0.9x1....

HTMLElement/Node 和 DOM 之间的区别?

作者:Shukai Ni 提问时间:8/12/2022

如果我理解正确的话,、、 和 是描述 DOM 树的不同级别的接口。例如,MDN 说HTMLElementElementDocumentNode DOM 节点接口是一个抽象的基类,许多其他 DOM A...

删除 &lt;br /&gt; 标记,这些标记是 &lt;ul&gt; 标记的不需要/无效的子项

作者:PTTW 提问时间:8/27/2022

如何从标签之间删除这些标签?<br /><ul> <p>Paragraph 1 <br /> Break line</p> <ul> <br /> <li> New Line</li> <br ...


共257条 当前第16页