使用 pandas 解析具有常见列名的嵌套 XML read_xml

Parsing Nested XML with common column names using pandas read_xml

提问人:Shekar Tippur 提问时间:11/16/2023 更新时间:11/16/2023 访问量:41

问:

我有一个嵌套的 xml 文件,具有通用列名(在本例中为 - 名称)。我需要解析此 XML 以具有不同的列。

  <Employee>
    <Name>Tanmay</Name>
    <City>
      <Name>ABC</Name>
      <County>
        <Name>Sunny</Name>
      </County>
    </City>
  </Employee>
</Company>

当我使用

df=pd.read_xml("your_xml_file.xml")
print(df)

我明白了

   Name  City
  Tanmay   NaN

我在熊猫中看到一个带有名字read_xml选项。我想知道是否可以将该选项用于我的用例以及如何使用它?

https://pandas.pydata.org/docs/reference/api/pandas.read_xml.html

nameslist-like, optional
Column names for DataFrame of parsed XML data. Use this parameter to rename original element names and distinguish same named elements and attributes.
Pandas 数据帧 XML 解析

评论

2赞 LMC 11/17/2023
请阅读您提供的 URL 部分。您可能需要使用 xslt 样式表来重新设计 xml 文档。另一种选择是使用 lxml 和 xpath 获取值并填充 dfNotes

答: 暂无答案