提问人:Évariste Galois 提问时间:11/26/2017 最后编辑:Évariste Galois 更新时间:11/27/2017 访问量:264
如何使用XML DOM读取xhtml?
How to read xhtml using XML DOM?
问:
我有以下.xhtml文件: https://pastebin.com/GUykneib
它本质上是一个 shell 脚本中网站上的 bash wget,我需要提取有关某些股票的行信息。下面是一个示例:
这是我的 Python 脚本:
import sys
import xml.dom.minidom
document = xml.dom.minidom.parse(sys.argv[1])
tableElements = document.getElementsByTagName('table')
for tr in tableElements[2].getElementsByTagName('tr'):
data = []
for td in tr.getElementsByTagName('td'):
for a in td.getElementsByTagName('a'):
for node in a.childNodes:
if node.nodeType == node.TEXT_NODE:
data.append(node.nodeValue)
print(data)
但是,当我在运行程序时传递 .xhtml 文件时,只打印一个空列表(只有一次,因为我遍历了 5 列,所以不应该至少是 5 次吗?我是XML DOM的新手,我的错误在哪里?
答: 暂无答案
评论
for a in td.getElementsByTagName('td'):
for a in td.getElementsByTagName('a'):
tableElements[2]
tableElements[0]
mdcTable