LXML 问答列表

lxml iterparse 会占用 4GB XML 文件的内存,即使使用 clear() 也是如此

作者:Elias S 提问时间:10/29/2023

该脚本的目的是提取每年出版的文章/书籍数量,并从 xml 文件 dblp-2023-10-01.xml 中的元素中获取此信息。该文件可以在这里找到:https://dblp.org/xml/relea...

在 lxml 中设置默认命名空间映射

作者:raywib 提问时间:11/8/2023

当使用 lxml 处理 XML 时,我的代码最终如下所示: from lxml import etree NSMAP = { 'ns1': 'https://example.com/ns1/',...

如何使用带有 0(1) 内存的 lxml?

作者:Istvan 提问时间:11/9/2023

我正在尝试使用~72G XML文件。我想将其转换为CSV。 这是我假设在后台使用迭代器的代码,因为我可能在关于 lxml 的某个地方读到过它。 from lxml import etree imp...

如何在XML文档上应用一组结构化的,通用的,嵌套的过滤器?

作者:kraytdragon 提问时间:11/10/2023

我有一组 XML 文档,我需要根据父级的一组条件进行筛选,并根据匹配父级的后代进行筛选。我希望用户能够编写一组可以以这种方式应用的结构化过滤器,无论是使用嵌套字典还是使用 PLY 之类的东西解析的查询...

Django 和 lxml 中的解码问题

作者:Deniz Dogan 提问时间:5/1/2009

在使用我的 Django 应用程序的已部署版本时,我对 lxml 有一个奇怪的问题。我使用 lxml 解析我从服务器获取的另一个 HTML 页面。这在我自己的计算机上的开发服务器上运行良好,但由于某种...

在 python 中使用 lxml 进行网络抓取后,我得到奇怪的字符而不是土耳其字符

作者:shuster 提问时间:9/21/2020

我一直在尝试使用 lxml lib 从某些网站获取数据。和 Python3。但是在网络抓取过程之后,我得到了一些奇怪的字符而不是土耳其字符。奇怪的字符如下所示。 TÃ1/4rkiye Engelli...

需要 python lxml 语法帮助来解析 html

作者:Shaheeb Roshan 提问时间:3/3/2009

我是python的新手,我需要一些关于使用lxml查找和遍历html标签的语法的帮助。以下是我正在处理的用例: HTML 文件的格式相当好(但并不完美)。屏幕上有多个表,一个包含一组搜索结果,一个表...

XML Insert 属性

作者:ob213 提问时间:5/19/2011

当我更新 xml 列时: SET XmlDocumentData.modify('insert attribute User {sql:variable("@User")} as last in...

如何在 Python2 中离线验证 xHtml1.1 文档

作者:Sebo.PL 提问时间:7/9/2018

我需要设置一个测试方法来验证作为 Python 字符串提供的标记是否有效 xHtml1.1。 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "h...

使用 LXML 从 html 文件中获取 xpath - Python

作者:Grégoire de Kermel 提问时间:4/1/2020

我正在学习如何使用 lxml 解析文档。为此,我正在尝试解析我的 LinkedIn 页面。它有很多信息,我认为这将是一次很好的培训。 上下文就够了。这是我正在做的事情: 转到URL:https:/...


共49条 当前第3页