如何使用xqilla命令行工具为xpath定义名称空间?

时间:2013-10-14 09:55:16

标签: xml xpath

我正在尝试使用一些xpath表达式从XML文件中提取信息(这是一个OAI-PMH协议响应):

<?xml version="1.0" encoding="UTF-8"?>

<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/
                             http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2013-10-11T09:24:55Z</responseDate>
  <request verb="ListRecords" metadataPrefix="oai_dc">http://request.url.com/oai</request>
  <ListRecords>
    <record>
      <header>
        <identifier>oai:identifier:item1</identifier>
        <datestamp>2012-06-07T12:03:53Z</datestamp>
        <setSpec>set:identifier</setSpec>
      </header>
      <metadata>
        <oai_dc:dc
            xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/"
            xmlns:dc="http://purl.org/dc/elements/1.1/"
            xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
            xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/
                                http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
          <dc:title xml:lang="en-US">Title</dc:title>
          <dc:creator>creator</dc:creator>
          <dc:description xml:lang="en-US">abstract</dc:description>
          <dc:publisher xml:lang="en-US">publisher</dc:publisher>
          <dc:contributor xml:lang="en-US"></dc:contributor>
          <dc:date>2011-10-18</dc:date>
          <dc:type xml:lang="en-US"></dc:type>
          <dc:format>application/pdf</dc:format>
          <dc:identifier>identifier</dc:identifier>
          <dc:source xml:lang="en-US">source</dc:source>
        </oai_dc:dc>
      </metadata>
    </record>
    <record>
     ...
    </record>
     ...
  </ListRecords>
</OAI-PMH>

最终我将不得不编写一些Java代码来执行此操作,但我想了解有关xpath和命名空间的更多信息,因此我使用命令行工具xqilla。

经过一些研究(例如this)和许多失败的尝试后,我尝试了以下表达式:

//*[local-name()='title']

但是我收到以下错误:

:1:22: error: No namespace for prefix 'xs' [err:XPST0081]

有人能指出我正确的方向吗?到目前为止,xqilla的文档尚未证明非常有用。

感谢。

编辑:由于标题并不是这里所要求的,所以后续(更一般)的问题是如何使用xqilla定义名称空间?因为如果我尝试表达式:

//dc:title

我得到的错误是

/tmp/foo.xq:1:3: error: No namespace for prefix 'dc' [err:XPST0081]

我正在运行xqilla:

xqilla -p -i oai_response.xml foo.xq

1 个答案:

答案 0 :(得分:3)

XQilla可以执行XPath,但默认情况下它使用XQuery。

您可以创建这样的xquery文件,例如:my.file.xquery

declare namespace dc="http://purl.org/dc/elements/1.1/";
doc("my.file.xml")//dc:title

然后运行它

xqilla my.file.xquery

如果你只想使用xpath,我不知道如何指定命名空间 您可以使用命名空间通配符。所以把它放在my.file.xpath

//*:title

运行它
xqilla -p -i my.file.xpath my.file.xml