使用 pandas 解析具有通用列名的嵌套 XML read_xml

Parsing Nested XML with common column names using pandas read_xml

提问人:Shekar Tippur 提问时间:11/16/2023 更新时间:11/16/2023 访问量:40

问:

我有一个嵌套的xml文件,具有通用的列名(在本例中为名称)。我需要解析此XML以具有不同的列。

  <Employee>
    <Name>Tanmay</Name>
    <City>
      <Name>ABC</Name>
      <County>
        <Name>Sunny</Name>
      </County>
    </City>
  </Employee>
</Company>

当我使用

df=pd.read_xml("your_xml_file.xml")
print(df)

我得到

   Name  City
  Tanmay   NaN

我在熊猫read_xml中看到一个带有名称的选项。我想知道我是否可以将该选项用于我的用例以及如何使用它?

https://pandas.pydata.org/docs/reference/api/pandas.read_xml.html

nameslist-like, optional
Column names for DataFrame of parsed XML data. Use this parameter to rename original element names and distinguish same named elements and attributes.
Pandas 数据帧 XML 解析

评论

2赞 LMC 11/17/2023
请阅读您提供的 URL 部分。您可能需要使用 xslt 样式表来重新设计 xml 文档。另一种选择是使用 lxml 和 xpath 获取值并填充 dfNotes

答: 暂无答案