我们如何在schematron错误消息输出中添加xpath信息

时间:2018-08-27 13:11:07

标签: xquery xslt-2.0 marklogic schematron

我正在MarkLogic中使用schematron API来验证XML文档。下面是供参考的代码段。

xquery version "1.0-ml";

import module namespace sch = "http://marklogic.com/validate" at 
"/MarkLogic/appservices/utils/validate.xqy";

import module namespace transform = "http://marklogic.com/transform" at "/MarkLogic/appservices/utils/transform.xqy";

declare namespace xsl = "http://www.w3.org/1999/XSL/not-Transform";

declare namespace iso = "http://purl.oclc.org/dsdl/schematron";


let $document :=
      document{
        <book xmlns="http://docbook.org/ns/docbook">
              <title>Some Title</title>
              <chapter>
              <para>...</para>
              </chapter>
        </book>
      }

let $schema := 
    <s:schema xmlns:s="http://purl.oclc.org/dsdl/schematron"
              xmlns:db="http://docbook.org/ns/docbook">
       <s:ns prefix="db" uri="http://docbook.org/ns/docbook"/>
       <s:pattern name="Glossary 'firstterm' type constraint">
          <s:rule context="db:chapter">
             <s:assert test="db:title">Chapter should contain title</s:assert>
          </s:rule>
       </s:pattern>
     </s:schema>
return
 sch:schematron($document, $schema)

任何人都可以帮助我获取上下文节点的XPath信息以及schematron错误消息输出。

2 个答案:

答案 0 :(得分:1)

以下是我认为您要的代码。

如果您想要某项的xpath,则可以使用xdmp:path。为了获得整个文档的xpath,您只需走一棵树,这就是递归函数local:getXpathDeep所做的。您可以更改我使用的string-join的输出格式,这对我来说更容易阅读。我创建了一个XML输出,将schematron结果和XPath都放入了其中,但是如果愿意,可以只返回一个序列,也可以将其放入地图中。

xquery version "1.0-ml";

import module namespace sch = "http://marklogic.com/validate" at 
"/MarkLogic/appservices/utils/validate.xqy";

import module namespace transform = "http://marklogic.com/transform" at "/MarkLogic/appservices/utils/transform.xqy";

declare namespace xsl = "http://www.w3.org/1999/XSL/not-Transform";

declare namespace iso = "http://purl.oclc.org/dsdl/schematron";

declare function local:getXpathDeep($node){
  (
    xdmp:path($node), 
    if (fn:exists($node/*)) then (
      local:getXpathDeep($node/*)
    ) else ()
  )
};

let $document :=
      document{
        <book xmlns="http://docbook.org/ns/docbook">
              <title>Some Title</title>
              <chapter>
              <para>...</para>
              </chapter>
        </book>
      }

let $schema := 
    <s:schema xmlns:s="http://purl.oclc.org/dsdl/schematron"
              xmlns:db="http://docbook.org/ns/docbook">
       <s:ns prefix="db" uri="http://docbook.org/ns/docbook"/>
       <s:pattern name="Glossary 'firstterm' type constraint">
          <s:rule context="db:chapter">
             <s:assert test="db:title">Chapter should contain title</s:assert>
          </s:rule>
       </s:pattern>
     </s:schema>
return
  <result>
    <contextNodeXpath>{fn:string-join(local:getXpathDeep($document), " 
    " )}</contextNodeXpath>
    <schematronOutPut>{sch:schematron($document, $schema)}</schematronOutPut>
  </result>

答案 1 :(得分:0)

该特定的Schematron模块相当有限,并且没有提供从报告或失败的断言返回上下文节点的XPath的方法。

标准Schematron SVRL输出确实包含触发失败的断言或报告的项目的XPath。

Norm Walsh发布了ML-Schematron module,该文档使用Schematron样式表将Schematron架构的编译包装到XSLT中,并随后执行已编译的XSLT以生成SVRL报告。

您可以调整模块以使用它(在安装模块和模块数据库中的standard Schematron XSLT files之后):

xquery version "1.0-ml";
declare namespace svrl="http://purl.oclc.org/dsdl/svrl";
import module namespace sch="http://marklogic.com/schematron" at "/schematron.xqy";

let $document :=
      document{
        <book xmlns="http://docbook.org/ns/docbook">
              <title>Some Title</title>
              <chapter>
              <para>...</para>
              </chapter>
        </book>
      }

let $schema := 
    <s:schema xmlns:s="http://purl.oclc.org/dsdl/schematron"
              xmlns:db="http://docbook.org/ns/docbook">
       <s:ns prefix="db" uri="http://docbook.org/ns/docbook"/>
       <s:pattern name="Glossary 'firstterm' type constraint">
          <s:rule context="db:chapter">
             <s:assert test="db:title">Chapter should contain title</s:assert>
          </s:rule>
       </s:pattern>
     </s:schema>

return
  sch:validate-document($document, $schema)

它会生成以下SVRL报告,其中在位置属性/*[local-name()='book']/*[local-name()='chapter']中包括XPath:

<svrl:schematron-output title="" schemaVersion="" xmlns:schold="http://www.ascc.net/xml/schematron" 
xmlns:iso="http://purl.oclc.org/dsdl/schematron" xmlns:xhtml="http://www.w3.org/1999/xhtml" 
xmlns:xs="http://www.w3.org/2001/XMLSchema" 
xmlns:db="http://docbook.org/ns/docbook" xmlns:axsl="http://www.w3.org/1999/XSL/TransformAlias" 
xmlns:svrl="http://purl.oclc.org/dsdl/svrl">
  <!---->
  <svrl:ns-prefix-in-attribute-values uri="http://docbook.org/ns/docbook" prefix="db"/>
  <svrl:active-pattern document=""/>
  <svrl:fired-rule context="db:chapter"/>
  <svrl:failed-assert test="db:title" location="/*[local-name()='book']/*[local-name()='chapter']">
    <svrl:text>Chapter should contain title</svrl:text>
  </svrl:failed-assert>
</svrl:schematron-output>