我正在尝试使用一些xpath表达式从XML文件中提取信息(这是一个OAI-PMH协议响应):
<?xml version="1.0" encoding="UTF-8"?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/
http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
<responseDate>2013-10-11T09:24:55Z</responseDate>
<request verb="ListRecords" metadataPrefix="oai_dc">http://request.url.com/oai</request>
<ListRecords>
<record>
<header>
<identifier>oai:identifier:item1</identifier>
<datestamp>2012-06-07T12:03:53Z</datestamp>
<setSpec>set:identifier</setSpec>
</header>
<metadata>
<oai_dc:dc
xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/
http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
<dc:title xml:lang="en-US">Title</dc:title>
<dc:creator>creator</dc:creator>
<dc:description xml:lang="en-US">abstract</dc:description>
<dc:publisher xml:lang="en-US">publisher</dc:publisher>
<dc:contributor xml:lang="en-US"></dc:contributor>
<dc:date>2011-10-18</dc:date>
<dc:type xml:lang="en-US"></dc:type>
<dc:format>application/pdf</dc:format>
<dc:identifier>identifier</dc:identifier>
<dc:source xml:lang="en-US">source</dc:source>
</oai_dc:dc>
</metadata>
</record>
<record>
...
</record>
...
</ListRecords>
</OAI-PMH>
最终我将不得不编写一些Java代码来执行此操作,但我想了解有关xpath和命名空间的更多信息,因此我使用命令行工具xqilla。
经过一些研究(例如this)和许多失败的尝试后,我尝试了以下表达式:
//*[local-name()='title']
但是我收到以下错误:
:1:22: error: No namespace for prefix 'xs' [err:XPST0081]
有人能指出我正确的方向吗?到目前为止,xqilla的文档尚未证明非常有用。
感谢。
编辑:由于标题并不是这里所要求的,所以后续(更一般)的问题是如何使用xqilla定义名称空间?因为如果我尝试表达式:
//dc:title
我得到的错误是
/tmp/foo.xq:1:3: error: No namespace for prefix 'dc' [err:XPST0081]
我正在运行xqilla:
xqilla -p -i oai_response.xml foo.xq
答案 0 :(得分:3)
XQilla可以执行XPath,但默认情况下它使用XQuery。
您可以创建这样的xquery文件,例如:my.file.xquery
declare namespace dc="http://purl.org/dc/elements/1.1/";
doc("my.file.xml")//dc:title
然后运行它
xqilla my.file.xquery
如果你只想使用xpath,我不知道如何指定命名空间 您可以使用命名空间通配符。所以把它放在my.file.xpath
中//*:title
用
运行它xqilla -p -i my.file.xpath my.file.xml