LXML 问答列表

在 Python 中使用请求和 LXML 抓取网站

作者:K Max 提问时间:10/4/2023

我正在尝试抓取此网站以检索标题和正文内容(“描述”和“功能”)以及 PDF 链接。但是,当我尝试使用 XPath 提取文本时,我收到一个空列表。但是,正如您在以下屏幕截图中看到的那样,后面有一个文本块...

有条件地将 XML(Word 文档)中的节点替换为 python?

作者:DOR 提问时间:9/26/2023

如何替换以附近标签内容为条件的 xml? 我有一个很长的 Word 文档,其中包含许多开发人员内容字段,特别是下拉列表。我想更改某些(但不是全部)下拉列表中的选项,这些选项以下拉列表的附近标签为条件...

从 XSD 架构中提取每个“名称”和“类型声明” - 使用 python 的嵌套定义

作者:Jammy1 提问时间:9/23/2023

我有几个架构定义文件,我需要将其捕获到 CSV 或表格格式文件中,我正在尝试提取名称和类型;Types 声明是复杂类型,它位于另一个文件中,如下所述: 目标是使用 Python 以表格格式打印以下示例...

如何在 SQL Server 中获取 xml 列的值

作者:Shakeer Hussain 提问时间:9/19/2023

如何获取列的XML值? SELECT PaymentMethodDetail.value('(/paymentMethodDetail/EFTPaymentDetails/AccountType/...

当有另一个带有文本的标签时,LXML 库不会提取给定 HTML 标签中的文本

作者:Minions 提问时间:8/3/2023

我有以下html脚本: <div> <p class="test1"> <i class="empty"> </i> WANTED TEXT </p> </div> 我想提取标签(...

XML : lxml.etree - findall() 当文档元素具有属性时

作者:macxpat 提问时间:5/1/2023

.findall()当 document 元素具有属性时,找不到任何内容。为什么会出现这种行为以及如何解决? 代码如下: from lxml import etree as et text = ...

非 ASCII 字符的语法错误 [duplicate]

作者:OpenCurious 提问时间:8/6/2013

这个问题在这里已经有答案了: “SyntaxError: Non-ASCII character ...”或“SyntaxError: Non-UTF-8 code starting with ......

我在使用 Python 从 XML 文件中以正确的顺序提取正确的数据时遇到问题

作者:Elliobu 提问时间:2/15/2023

这是我写的代码片段: from lxml import etree as lxmlET lxmltree = lxmlET.parse('sample.xml') for names in lxml...

使用自关闭标记从 xml 导出文本

作者:hedone5628 提问时间:2/19/2023

我有一组 XML TEI 文件,其中包含文档的转录。我想解析这些XML文件并仅提取文本信息。 我的 XML 如下所示: <?xml version='1.0' encoding='UTF8'?> ...

Python 代码在 Linux 上解析 XML,但在 Mac 上不解析 XML

作者:SHIVAM SINGH 提问时间:11/14/2023

我有一个代码,它使用 .lxml from lxml.etree import fromstring s = """<Abstract><AbstractText>The genus Cinch...


共49条 当前第2页