如何在 Python 中针对 DTD 文件验证 xml

How do I validate xml against a DTD file in Python

提问人:fulmicoton 提问时间:8/19/2008 最后编辑:Michael Schmidtfulmicoton 更新时间:4/23/2016 访问量:10801

问:

我需要验证 XML 字符串(而不是文件) 针对 DTD 描述文件。

这怎么能在?python

Python XML 验证 DTD

评论


答:

32赞 Michael Twomey 8/19/2008 #1

另一个不错的选择是 lxml 的验证,我觉得使用起来很愉快。

从 lxml 站点获取的简单示例:

from StringIO import StringIO

from lxml import etree

dtd = etree.DTD(StringIO("""<!ELEMENT foo EMPTY>"""))
root = etree.XML("<foo/>")
print(dtd.validate(root))
# True

root = etree.XML("<foo>bar</foo>")
print(dtd.validate(root))
# False
print(dtd.error_log.filter_from_errors())
# <string>:1:0:ERROR:VALID:DTD_NOT_EMPTY: Element foo was declared EMPTY this one has content
7赞 guest 11/7/2008 #2

从 libxml2 python 绑定中的 examples 目录:

#!/usr/bin/python -u
import libxml2
import sys

# Memory debug specific
libxml2.debugMemory(1)

dtd="""<!ELEMENT foo EMPTY>"""
instance="""<?xml version="1.0"?>
<foo></foo>"""

dtd = libxml2.parseDTD(None, 'test.dtd')
ctxt = libxml2.newValidCtxt()
doc = libxml2.parseDoc(instance)
ret = doc.validateDtd(ctxt, dtd)
if ret != 1:
    print "error doing DTD validation"
    sys.exit(1)

doc.freeDoc()
dtd.freeDtd()
del dtd
del ctxt

评论

0赞 ChuckB 11/7/2008
请注意,libxml2 绑定不是 Python 标准库的一部分,即不是内置的。