计算 xml 标记中最常见的元素

Count most frequent element in an xml tag

提问人:mmmmmmmmm 提问时间:3/30/2021 更新时间:3/30/2021 访问量:88

问:

我正在尝试编写一个 xsl 代码来查看出现次数最多的日志名称。我尝试在谷歌上搜索它,但无法理解其中的大部分内容(我是 xslt 的新手)。谁能帮我解决这个问题?

我的 XML(只有一个条目):

<Bibliography>
  <row>
    <Title>Title-B-0</Title>
    <Author>Jason Adair</Author>
    <Year>2015</Year>
    <Publication_Name>ACM</Publication_Name>
    <DOI>533/49</DOI>
    <Date>6/2/2021</Date>
    <Journal_Name>journal-s</Journal_Name>
    <Journal_Volume>9</Journal_Volume>
    <Journal_Issue>8</Journal_Issue>
    <Conference_Name></Conference_Name>
    <Conference_Location></Conference_Location>
    <Book_Title></Book_Title>
    <Book_Editor></Book_Editor>
  </row>
</Bibliography>

我的 XSL 方法:

<xsl:variable name="maximum">
    <xsl:for-each select="//row">
        <xsl:sort  select="count(//row[@Journal_Name=current()/@Journal_Name])" order="descending" />
        <xsl:if test="position() = 1">
            <xsl:value-of select="." />
        </xsl:if>
    </xsl:for-each>
</xsl:variable>

Most occuring value of journal is: <xsl:value-of select = "$maximum" />

此外,在我正在观看的 YouTube 教程中,这家伙在浏览器中运行了 xml,它会自动设置样式,但当我这样做时,我不能。新浏览器是否不再支持 xml 和 xsl?

XML xslt xhtml

评论


答:

0赞 michael.hor257k 3/30/2021 #1

这实际上是一个分组问题。假设您使用的是 XSLT 1.0 处理器,则最好使用 Muenchian 分组方法的变体。下面是一个简化的示例:

XML格式

<Bibliography>
    <row>
        <Journal_Name>journal-a</Journal_Name>
    </row>
    <row>
        <Journal_Name>journal-b</Journal_Name>
    </row>
    <row>
        <Journal_Name>journal-c</Journal_Name>
    </row>
    <row>
        <Journal_Name>journal-b</Journal_Name>
    </row>
    <row>
        <Journal_Name>journal-c</Journal_Name>
    </row>
    <row>
        <Journal_Name>journal-d</Journal_Name>
    </row>
    <row>
        <Journal_Name>journal-b</Journal_Name>
    </row>
</Bibliography>

XSLT 1.0

<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes"/>

<xsl:key name="row-by-journal" match="row" use="Journal_Name" />

<xsl:template match="/Bibliography">
    <output>
        <!-- for each distinct journal name -->
        <xsl:for-each select="row[count(. | key('row-by-journal', Journal_Name)[1]) = 1]">
            <!-- sort by group size -->
            <xsl:sort select="count(key('row-by-journal', Journal_Name))" data-type="number" order="descending"/>
            <xsl:if test="position() = 1">
                <xsl:value-of select="Journal_Name" />
            </xsl:if>
        </xsl:for-each>
    </output>
</xsl:template>

</xsl:stylesheet>

结果

<?xml version="1.0" encoding="UTF-8"?>
<output>journal-b</output>

请注意,如果出现平局,此方法将仅返回一个最高值。

评论

0赞 mmmmmmmmm 3/30/2021
很抱歉,但解决方案不起作用。它只打印空白的结束输出标签。为此,我正在使用免费的格式化程序 xsl-transformer
0赞 michael.hor257k 3/31/2021
有一个错别字 - 现在试试。
0赞 mmmmmmmmm 3/31/2021
当我使用“.”而不是“Journal_Name”打印出内容时,它打印出第二个的内容xsl:value-ofrow
0赞 mmmmmmmmm 3/31/2021
还是那个先生。我在执行过程中第一次纠正了错别字
0赞 michael.hor257k 3/31/2021
您可以在此处看到它的工作原理: xsltfiddle.liberty-development.net/3MEdvib