试图在XBRL实例文档中找到以下两行

时间:2015-02-15 11:30:50

标签: xslt xbrl

我正在尝试找到xslt解决方案以解决我遇到的以下问题。

我想找到一组3个后续行,它们共享节点名称和属性但具有不同的值。输入中的第一行包含标识符,第二行和第三行包含源系统的值。我想找到第二行和第三行具有不同值的集合。

E.g。

<eba7:mi235 contextRef="I-2014-E-dim-x43-x9-x156-x51-x14">78923</eba7:mi235>
<eba7:mi235 contextRef="I-2014-E-dim-x43-x9-x156-x51-x14">1111</eba7:mi235>
<eba7:mi235 contextRef="I-2014-E-dim-x43-x9-x156-x51-x14">2222</eba7:mi235>

可能还有一组行只有一个标识符,一组带有标识符的行,只有一行带有源系统的值,或者一组行,其中第二行和第三行具有相同的值。

E.g。

<eba7:mi310 contextRef="I-2014-E-dim-x42-x9-x24-x195-x10-x4">78748</eba7:mi310>
<eba7:mi310 contextRef="I-2014-E-dim-x42-x9-x24-x195-x10-x4">0</eba7:mi310>
<eba7:mi310 contextRef="I-2014-E-dim-x42-x9-x25-x195-x10-x4">78804</eba7:mi310>
<eba7:mi310 contextRef="I-2014-E-dim-x42-x9-x25-x195-x10-x4">12345</eba7:mi310>
<eba7:mi310 contextRef="I-2014-E-dim-x42-x9-x25-x195-x10-x4">12345</eba7:mi310>

这些我不想在输出中找到。

我想要创建的输出是

<eba7:mi235 id="78923" value1="1111" value2="2222" />

输入的结构使得行总是这样排序。所以我尝试使用位置访问它们,但这不起作用。

有人能指出我正确的方向吗?是以正确的方式使用职位吗?

我附上了一个包含

输入数据的文件

感谢。

保罗。

<?xml version="1.0" encoding="utf-8"?>
<xbrl xml:lang="en" xmlns="http://www.xbrl.org/2003/instance" xmlns:eba7="http://www.eba.europa.eu/xbrl/crr/dict/met" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:link="http://www.xbrl.org/2003/linkbase">
<link:schemaRef xlink:type="simple" xlink:href="http://www.eba.europa.eu/eu/fr/xbrl/crr/fws/corep/its-2013-02/2014-07-31/mod/corep_con.xsd" />
<context id="I-2014-E">
<entity>
  <identifier scheme="http://www.dnb.nl/id">578</identifier>
</entity>
<period>
  <instant>2014-12-31</instant>
</period>
</context>  
<eba7:mi310 contextRef="I-2014-E-dim-x42-x9-x24-x195-x10-x4">78748</eba7:mi310>
<eba7:mi310 contextRef="I-2014-E-dim-x42-x9-x24-x195-x10-x4">0</eba7:mi310>
<eba7:mi310 contextRef="I-2014-E-dim-x42-x9-x25-x195-x10-x4">78804</eba7:mi310>
<eba7:mi310 contextRef="I-2014-E-dim-x42-x9-x25-x195-x10-x4">12345</eba7:mi310>
<eba7:mi310 contextRef="I-2014-E-dim-x42-x9-x25-x195-x10-x4">12345</eba7:mi310>
<eba7:mi235 contextRef="I-2014-E-dim-x43-x9-x156-x51-x14">78923</eba7:mi235>
<eba7:mi235 contextRef="I-2014-E-dim-x43-x9-x156-x51-x14">1111</eba7:mi235>
<eba7:mi235 contextRef="I-2014-E-dim-x43-x9-x156-x51-x14">2222</eba7:mi235>
</xbrl>

2 个答案:

答案 0 :(得分:2)

我认为问题的定义不够好;它可以用几种方式解释。

如果我们假设你想:

  1. 根据 标记名称和@contextRef值相同,对所有给定元素进行分组;因为元素的相互位置与此目的无关;

  2. 计算每个组中的不同值;如果有三个或更多,请将具有公共标记名称的元素写入输出,并为该组中的每个不同值添加编号属性;

  3. 那么最好做一些事情:

    XSLT 1.0

    <xsl:stylesheet version="1.0"
    xmlns:xbrli="http://www.xbrl.org/2003/instance" 
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="xml" version="1.0" encoding="utf-8" indent="yes"/>
    
    <xsl:key name="k1" match="*" use="concat(name(), '|', @contextRef)"/>
    <xsl:key name="k2" match="*" use="concat(name(), '|', @contextRef, '|', .)"/>
    
    <xsl:template match="/xbrli:xbrl">
        <xsl:copy>
            <xsl:for-each select="*[count(.|key('k1', concat(name(), '|', @contextRef))[1])=1]">
                <xsl:variable name="distinct-values" select="key('k1', concat(name(), '|', @contextRef)) [count(.|key('k2', concat(name(), '|', @contextRef, '|', .))[1])=1]"/>
                <xsl:if test="count($distinct-values) &gt;= 3">
                    <xsl:copy>
                        <xsl:for-each select="$distinct-values">
                            <xsl:attribute name="value{position()}">
                                <xsl:value-of select="."/>
                            </xsl:attribute>
                        </xsl:for-each>
                    </xsl:copy>
                </xsl:if>
            </xsl:for-each>
        </xsl:copy>
    </xsl:template>
    
    </xsl:stylesheet>
    

    应用于以下格式良好的测试输入

    <xbrl xmlns="http://www.xbrl.org/2003/instance" xmlns:eba7="http://www.eba.europa.eu/xbrl/crr/dict/met">
        <eba7:a contextRef="x">11</eba7:a>
        <eba7:a contextRef="x">12</eba7:a>
    
        <eba7:a contextRef="y">21</eba7:a>
        <eba7:a contextRef="y">22</eba7:a>
        <eba7:a contextRef="y">23</eba7:a>
    
        <eba7:b contextRef="x">31</eba7:b>
        <eba7:b contextRef="x">32</eba7:b>
        <eba7:b contextRef="x">33</eba7:b>
        <eba7:b contextRef="x">33</eba7:b>
    
        <eba7:c contextRef="x">41</eba7:c>
        <eba7:c contextRef="x">41</eba7:c>
        <eba7:c contextRef="x">42</eba7:c>
        <eba7:c contextRef="x">42</eba7:c>
    </xbrl>
    

    结果将是:

    <?xml version="1.0" encoding="utf-8"?>
    <xbrl xmlns="http://www.xbrl.org/2003/instance" xmlns:eba7="http://www.eba.europa.eu/xbrl/crr/dict/met">
       <eba7:a value1="21" value2="22" value3="23"/>
       <eba7:b value1="31" value2="32" value3="33"/>
    </xbrl>
    

    注意

    1. 您必须熟悉 Muenchian分组方法才能理解这一点;

    2. 编号属性不是很好的XML实践。我建议你(或权力)重新考虑这个要求。

答案 1 :(得分:1)

此样式表是否可以解决您的问题:

<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"  xmlns:xbrli="http://www.xbrl.org/2003/instance" version="1.0">
<xsl:output method="xml" version="1.0" encoding="UTF-8" indent="yes" />
<xsl:strip-space elements="*"/>

<xsl:key name="elements" match="*" use="@contextRef"/>

<xsl:template match="/xbrli:xbrl">
    <xsl:copy>
        <xsl:apply-templates select="*[@contextRef
                                        and count(key('elements', @contextRef)) = 3 
                                        and key('elements', @contextRef)[2] != key('elements', @contextRef)[3]
                                        and count(. | key('elements', @contextRef)[1]) = 1]"/>
    </xsl:copy>
</xsl:template>

<xsl:template match="*">
    <xsl:copy>
        <xsl:attribute name="id">
            <xsl:value-of select="."/>
        </xsl:attribute>
        <xsl:attribute name="value1">
            <xsl:value-of select="key('elements', @contextRef)[2]"/>
        </xsl:attribute>
        <xsl:attribute name="value2">
            <xsl:value-of select="key('elements', @contextRef)[3]"/>
        </xsl:attribute>
    </xsl:copy>
</xsl:template>
</xsl:stylesheet>

此处,声明key匹配以@contextRef为标识符的元素。第一个模板将模板应用于具有唯一@contextRef的第一个元素(以及那些与其他条件匹配的元素,例如@contextRef的总元素必须为3,而第二个和第三个元素必须不具有相同的值)。

下一个模板匹配这些元素(来自第一个模板),并创建更多输出。