lxml.etree.XMLSyntaxError：输入不正确的UTF-8，指示编码？-解网

问：

我有一个包含 200 万个观测值的 xml 文件，我想将其转换为 csv，但我收到以下错误。

File "src\lxml\parser.pxi", line 609, in lxml.etree._ParserContext._handleParseResult
File "src\lxml\parser.pxi", line 618, in lxml.etree._ParserContext._handleParseResultDoc
File "src\lxml\parser.pxi", line 728, in lxml.etree._handleParseResult
File "src\lxml\parser.pxi", line 657, in lxml.etree._raiseParseError
File "input/stackoverflow.com/Posts.xml", line 9 lxml.etree.XML
SyntaxError: Input is not proper UTF-8, indicate encoding ! Bytes: 0xFC 0x74 0xFC 0x70, line 9, column 360

我已经包含了 encoding= “utf-8”，但我不确定这个错误的来源是什么。谁能帮忙？

我也尝试了下面的代码，它给了我类似的编码错误。

from lxml import etree
parser = etree.XMLParser(recover=True)
etree.fromstring(filename, parser=parser)

error: xml.etree.ElementTree.ParseError: not well-formed (invalid token): line 9, column 359

xml utf-8 堆栈溢出

lxml.etree.XMLSyntaxError：输入不正确的UTF-8，指示编码？

lxml.etree.XMLSyntaxError: Input is not proper UTF-8, indicate encoding?

评论

评论