使用 XPath 获取 XML 元素的层次结构

Get the hierarchy of a XML element with XPath

提问人:Curious 提问时间:5/8/2021 最后编辑:Curious 更新时间:5/8/2021 访问量:247

问:

我正在尝试在“application/xml”response.data文档中获取给定元素层次结构的有序列表,我使用Javascript中的DOM解析器解析该文档。因此,表达式应为每个没有 A 子项的 A 标记返回列表 ['Grand Parent','Parent','Target']。因此,我将得到一个列表列表,其中内部列表的最后一个元素将是 <A-title> 的最深(就图形深度而言)值。 多亏了 @Jack Fleeting,我知道我可以使用下面的表达式 xpath 来获取目标:但我不确定如何调整它以进入层次结构列表。xpath = '//*[local-name()="A"][not(.//*[local-name()="A"])]/*[local-name()="A-title"]'

<A>
<A-title>Grand Parent</A-title>
   <A>
   <A-title>Parent</A-title>
      <A>
      <A-title>Target</A-title>
      </A>
   </A>
</A>

编辑:

axios.get('WMS_URL').then((r) => {
      const parser = new DOMParser()
      const dom = parser.parseFromString(r.data, 'application/xml')
       let xpath = '//*[local-name()="A"][not(.//*[local-name()="A"])]/*[local-name()="A-title"]'
       let xpath2 = 'ancestor-or-self::A/A-title'
       var targets = dom.evaluate(xpath, dom, null, XPathResult.ORDERED_NODE_SNAPSHOT_TYPE, null)
       var targets2 = dom.evaluate(xpath2, targets, null, XPathResult.ORDERED_NODE_SNAPSHOT_TYPE, null)
       Array.from({ length: targets2.snapshotLength }, (_, index) => layerNames.push(targets2.snapshotItem(index).innerHTML))
javascript xml xpath dom 遍历

评论


答:

1赞 Martin Honnen 5/8/2021 #1

如果您使用 XPath,则所有元素都没有子元素,下一步将导航到所有祖先或自身元素,最后导航到所有子元素。当然,在 XPath 1 中,使用单个表达式,您无法构建字符串(或元素?)列表的列表,因此您首先需要选择 sel3ect,然后从那里选择元素。//A[not(A)]/ancestor-or-self::A/A-title//A[not(A)]AAAA-title//A[not(A)]ancestor-or-self::A/A-title

使用 XPath 3.1,例如使用 Saxon JS 2 (https://www.saxonica.com/saxon-js/index.xmlmhttps://www.saxonica.com/saxon-js/documentation/index.html),您可以直接构造字符串数组序列,例如

//A[not(A)] ! array { ancestor-or-self::A/A-title/data() }

用于评估 XPath 的 JavaScript 代码是

let result = SaxonJS.XPath.evaluate('parse-xml($xml)//A[not(A)] ! array { ancestor-or-self::A/A-title/data() }', [], { params : { 'xml' : r.data }})

使用 DOM Level 3 XPath 1.0,我认为您需要更多代码行:

let xmlDoc = new DOMParser().parseFromString(r.data, 'application/xml');

let leafAElements = xmlDoc.evaluate('//A[not(A)]', xmlDoc, null, XPathResult.ORDERED_NODE_ITERATOR_TYPE, null);

let result = [];

for (let i = 0; i < leafAElements.snapshotLength; i++) { 
  let titleEls = xmlDoc.evaluate('ancestor-or-self::A/A-title', leafAElements.snapshotItem(i), null, XPathResult.ORDERED_NODE_SNAPSHOT_TYPE, null);
  let titles = []; 
  for (let j = 0; j < titleEls.snapshotLength; j++) { 
    titles.push(titleEls.snapshotItem(j).textContent); 
  } 
  result.push(titles); 
}

评论

0赞 Martin Honnen 5/8/2021
如果您使用 Saxon JS 2 而不是使用 DOMParser 和 XPath 1,我会使用例如.然后,处理程序中的变量是具有值的字符串数组的 JavaScript 数组。evaluateaxios.get('WMS_URL').then((r) => { let result = SaxonJS.XPath.evaluate('parse-xml($xml)//A[not(A)] ! array { ancestor-or-self::A/A-title/data() }', [], { params : { 'xml' : r.data }}); })resultthenA-title