LXML 问答列表

为什么 lxml 在解析时关闭这个“ol”标签?

作者:dfrankow 提问时间:7/27/2021

以下是一些 HTML: <ol><ul><li>item</li></ul></ol> 和一些 Python 3 代码来解析它并重新打印它:lxml import sys from lxml ...

在 Python 中使用 lxml 和 XPath 清理 HTML

作者:Lexx Luxx 提问时间:8/22/2021

我正在学习python和lxml工具包。我需要处理本地目录中的多个 .htm 文件(递归)并删除不需要的标签,包括其内容(ID 为“box”、“columnRight”、“adbox”、“footer...

我正在使用 lxml.html 在 HTML 文件中添加新标签,然后对其进行操作,但它似乎不起作用

作者:Shubham Gupta 提问时间:10/27/2021

for y in row_data: say = html.fromstring( str(html.tostring(y)).lstrip("b'").replace('">', '"><spa...

Beautiful Soup 只提取一个标签,当可以在 html 代码中看到所有其他标签时

作者:Jake Wright 提问时间:11/21/2021

试图了解网页抓取的工作原理: import requests from bs4 import BeautifulSoup as soup url = "https://webscraper.io/t...

使用封闭的标记解析 HTML 表(lxml、XPath)

作者:pupinho 提问时间:1/14/2022

任务是解析大型 HTML 表,因此我将 lxml 与 XPath 查询一起使用。有时,表格单元格可以包含封闭的标签(例如 SPAN) <html> <table> <tr> <td>1</td...

获取可迭代节点之间的所有文本节点

作者:Minki Choe 提问时间:1/21/2022

如何使用 python3 和 lxml 库在可迭代节点之间获取文本节点。 我试图从每次迭代中获取所有文本。<b> 我想要的结果: [ ("A1", "Attr1: A1", "Attr2: B1...

Python:LXML - 如何将特定标签下的元素添加到现有元素树中

作者:Francis Bacon 提问时间:10/13/2022

我使用以下代码尝试将元素附加到 tag 下。resources parser = Et.XMLParser(strip_cdata=False) xml_tree = Et.parse(destin...

我试图使用 python 验证 XMl 文件 aginst xsd

作者:Nisha naik 提问时间:11/10/2022

这是我的XML文件: \<Orderdetails\> \<Customer id="011"\> \<cname\>Mark Lewis\</cname\> \<destination Count...

使用 LXML 库使用额外的“\n”和空格进行 XML 解析

作者:Aiyu Sheng 提问时间:11/19/2022

我用 lxml 库编写了一个 python 程序,以使用其 xpath 解析 xml 文件。value 和 xpath 都是正确的,但它会返回许多“\n”和空格,就像 xml 文件的格式一样。 这是...


共49条 当前第5页