如何从XPath函数返回文本片段?

时间:2013-07-11 09:24:57

标签: python lxml

假设我有一个XPath函数,我正在使用lxmllibxmllibxslt)从XSL转换调用,例如:

<xsl:template match="/">
  <xsl:variable name="result" select="myns:my-func(./*)" />
  ...
</xsl:template>

从这个函数中,我想返回一个包含以下内容的XML片段:

some sample <em>text</em>

使用my_func可以通过XSL样式表正确设置python函数lxml,并使用lxml.html.fragments_fromstring获取格式为的结果:

['some sample ', <Element em at 0x106c203b0>]

如何返回此列表,以便稍后可以在变量的XSL转换中使用它,就像它是直接在XSL上下文中从XPath表达式收集一样?似乎每当我将字符串列表传递回XSL处理器lxml时都会引发异常。

1 个答案:

答案 0 :(得分:3)

首先要定义你的功能。它需要将节点集作为项列表返回。这些项目可能包括元素(也包括注释和处理指令),字符串和元组。

硬编码示例可能如下所示:

from lxml import etree

def myFunc(context, parm):
  em = etree.Element('em')
  em.text = 'text'
  return ['some sample ', em]

请注意,在这种情况下不需要 parm 参数,但我在此处将其包含在内以匹配您在调用 myns中传递参数的示例代码:my -func

如果您想使用 fragments_fromstring 来构建节点集,而不是手动构建它,那么函数定义会变得更加简单。

def myFunc(context, parm):           
  import lxml.html
  return lxml.html.fragments_fromstring('some sample <em>text</em>')

接下来,您需要设置命名空间并注册函数名称。

myns = etree.FunctionNamespace('http://example.org/myNamespace')
myns['my-func'] = myFunc

最后,您可以在XSLT样式表中使用它,如下所示:

<xsl:stylesheet version="1.0"
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
    xmlns:myns="http://example.org/myNamespace">
  <xsl:template match="/">                                   
    <xsl:variable name="result" select="myns:my-func(./*)" />
    <xsl:for-each select="$result">
      <xsl:copy-of select="." />
    </xsl:for-each>         
  </xsl:template>
</xsl:stylesheet>

请注意,样式表中使用的名称空间URL必须与 FunctionNamespace 中注册的名称空间匹配。

现在假设您已将此样式表加载到名为 xslt 的字符串中,示例转换可能如下所示:

root = etree.XML('<root></root>')
doc = etree.ElementTree(root)
transform = etree.XSLT(etree.XML(xslt))
res = transform(doc)

有关完整的工作示例,请参阅此pastebin link