我需要一些帮助,想出一个合适的XPath表达式来从XML中提取值。
我可以使用jaxb获取值但是我需要xpath因为我有一个决策表类型的映射规则我想要外部化,如果我使用jaxb会导致很多嵌套的if / else语句我想避免因此需要xpath方法。
我有一个xml文件,它至少构建了4个模式。我的意思是根模式在特定点有一个元素,表示xs:any,在这个位置注入一个基于不同模式的xml,这反过来又有一个类似的xs:any注入另一个xml来构建final /我正在使用的实际xml。
这是我正在处理的实际XML结构(我故意修改了这些值)。下面xml中的两个Document节点基于不同的模式
<?xml version="1.0"?>
<env:Envelope xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:env="CDTS-SUBMIT">
<env:Body>
<cdtPrefix>
<cdtprVersion>01</cdtprVersion>
<cdtprOperation>SUBMIT</cdtprOperation>
<cdtprFunction>GCAMS1O</cdtprFunction>
<cdtprDirectionFlag>O</cdtprDirectionFlag>
</cdtPrefix>
<cdtDataDescription>
<cdtddVersion>01</cdtddVersion>
<cdtddFirmId>ABC</cdtddFirmId>
<cdtddBusinessDataFormat>GCAMS1O-XML</cdtddBusinessDataFormat>
<cdtddReferenceNum>123</cdtddReferenceNum>
<cdtddTrackingNum>123</cdtddTrackingNum>
<cdtddDestination>AQ</cdtddDestination>
<cdtddSeqNum>0000000</cdtddSeqNum>
<cdtddCycleNum>00</cdtddCycleNum>
<cdtddBusinessDate>00000000</cdtddBusinessDate>
</cdtDataDescription>
<cdtBusinessData>
<AppHdr xmlns="urn:iso:std:iso:20022:tech:xsd:head.001.001.01" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<Fr>
<FIId>
<FinInstnId>
<BICFI>ABC</BICFI>
</FinInstnId>
</FIId>
</Fr>
<To>
<FIId>
<FinInstnId>
<BICFI>ABC </BICFI>
</FinInstnId>
</FIId>
</To>
<BizMsgIdr>ABC</BizMsgIdr>
<MsgDefIdr>seev.031.002.05</MsgDefIdr>
<BizSvc>CSD</BizSvc>
<CreDt>9999-99-99T00:02:17Z</CreDt>
</AppHdr>
<Document xmlns="urn:swift:xsd:seev.031.002.05" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<CorpActnNtfctn>
<NtfctnGnlInf>
<NtfctnTp>REPL</NtfctnTp>
<PrcgSts>
<Cd>
<EvtCmpltnsSts>COMP</EvtCmpltnsSts>
<EvtConfSts>CONF</EvtConfSts>
</Cd>
</PrcgSts>
</NtfctnGnlInf>
<PrvsNtfctnId>
<Id>00000000</Id>
</PrvsNtfctnId>
<EvtsLkg>
<EvtId>
<LkdOffclCorpActnEvtId>US8</LkdOffclCorpActnEvtId>
</EvtId>
<LkgTp>
<Cd>INFO</Cd>
</LkgTp>
</EvtsLkg>
<CorpActnGnlInf>
<CorpActnEvtId>000</CorpActnEvtId>
<OffclCorpActnEvtId>US7</OffclCorpActnEvtId>
<EvtPrcgTp>
<Cd>DISN</Cd>
</EvtPrcgTp>
<EvtTp>
<Cd>INTR</Cd>
</EvtTp>
<MndtryVlntryEvtTp>
<Cd>CHOS</Cd>
</MndtryVlntryEvtTp>
<UndrlygScty>
<FinInstrmId>
<OthrId>
<Id>J54675AA1</Id>
<Tp>
<Cd>CUSP</Cd>
</Tp>
</OthrId>
<Desc>JASDFKASDFADSFAFADSF</Desc>
</FinInstrmId>
<ClssfctnTp>
<ClssfctnFinInstrm>DBXXXX</ClssfctnFinInstrm>
</ClssfctnTp>
</UndrlygScty>
</CorpActnGnlInf>
<AcctDtls>
<ForAllAccts>
<IdCd>GENR</IdCd>
</ForAllAccts>
</AcctDtls>
<CorpActnDtls>
<DtDtls>
<RcrdDt>
<Dt>
<Dt>0000-04-03</Dt>
</Dt>
</RcrdDt>
</DtDtls>
<RateAndAmtDtls>
<Intrst>
<Rate>0</Rate>
</Intrst>
</RateAndAmtDtls>
<IntrstAcrdNbOfDays>0</IntrstAcrdNbOfDays>
</CorpActnDtls>
<CorpActnOptnDtls>
<OptnNb>001</OptnNb>
<OptnTp>
<Cd>CASH</Cd>
</OptnTp>
<DfltPrcgOrStgInstr>
<DfltOptnInd>true</DfltOptnInd>
</DfltPrcgOrStgInstr>
<DtDtls>
<RspnDdln>
<Dt>
<DtTm>0000-04-10T20:00:00-04:00</DtTm>
</Dt>
</RspnDdln>
</DtDtls>
<PrdDtls>
<ActnPrd>
<Prd>
<StartDt>
<Dt>
<DtTm>0000-04-06T00:00:00-04:00</DtTm>
</Dt>
</StartDt>
<EndDt>
<NotSpcfdDt>UKWN</NotSpcfdDt>
</EndDt>
</Prd>
</ActnPrd>
</PrdDtls>
<CshMvmntDtls>
<CdtDbtInd>CRDT</CdtDbtInd>
<IncmTp>
<Id>0004</Id>
<Issr>IRSX</Issr>
</IncmTp>
<DtDtls>
<PmtDt>
<Dt>
<Dt>0000-04-18</Dt>
</Dt>
</PmtDt>
</DtDtls>
<RateAndAmtDtls>
<IntrstRateUsdForPmt>
<RateTpAndAmtAndRateSts>
<RateTp>
<Cd>SCHD</Cd>
</RateTp>
<Amt Ccy="USD">21.17125</Amt>
</RateTpAndAmtAndRateSts>
</IntrstRateUsdForPmt>
<WhldgOfLclTax>
<Rate>15.315</Rate>
</WhldgOfLclTax>
</RateAndAmtDtls>
</CshMvmntDtls>
</CorpActnOptnDtls>
<CorpActnOptnDtls>
<OptnNb>002</OptnNb>
<OptnTp>
<Cd>CASH</Cd>
</OptnTp>
<OptnFeatrs>
<Cd>ASVO</Cd>
</OptnFeatrs>
<DfltPrcgOrStgInstr>
<DfltOptnInd>false</DfltOptnInd>
</DfltPrcgOrStgInstr>
<DtDtls>
<RspnDdln>
<Dt>
<DtTm>0000-04-10T20:00:00-04:00</DtTm>
</Dt>
</RspnDdln>
</DtDtls>
<PrdDtls>
<ActnPrd>
<Prd>
<StartDt>
<Dt>
<DtTm>0000-04-06T00:00:00-04:00</DtTm>
</Dt>
</StartDt>
<EndDt>
<NotSpcfdDt>UKWN</NotSpcfdDt>
</EndDt>
</Prd>
</ActnPrd>
</PrdDtls>
<CshMvmntDtls>
<CdtDbtInd>CRDT</CdtDbtInd>
<IncmTp>
<Id>0004</Id>
<Issr>IRSX</Issr>
</IncmTp>
<DtDtls>
<PmtDt>
<Dt>
<Dt>0000-04-18</Dt>
</Dt>
</PmtDt>
</DtDtls>
<RateAndAmtDtls>
<IntrstRateUsdForPmt>
<RateTpAndAmtAndRateSts>
<RateTp>
<Cd>SCHD</Cd>
</RateTp>
<Amt Ccy="USD">25</Amt>
</RateTpAndAmtAndRateSts>
</IntrstRateUsdForPmt>
<WhldgOfLclTax>
<Rate>0</Rate>
</WhldgOfLclTax>
</RateAndAmtDtls>
</CshMvmntDtls>
</CorpActnOptnDtls>
<AddtlInf>
<AddtlTxt>
<UpdDt>0000-04-04</UpdDt>
<AddtlInf> adfafadfasdfasdfasdfsdafadfdsafdf</AddtlInf>
</AddtlTxt>
</AddtlInf>
<Regar>
<NmAndAdr>
<Nm>Not Available</Nm>
</NmAndAdr>
</Regar>
<SplmtryData>
<Envlp>
<Document xmlns="urn:swift:xsd:supl.001.001.05" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
<DTCCCANOCSDDataSD1>
<NtfctnGnlInf>
<PlcAndNm>/Document/CorpActnNtfctn/NtfctnGnlInf</PlcAndNm>
<CretDtAndTm>0000-04-24T11:34:09</CretDtAndTm>
<UpdDtAndTm>0000-04-24T20:02:16</UpdDtAndTm>
</NtfctnGnlInf>
<CorpActnGnlInf>
<PlcAndNm>/Document/CorpActnNtfctn/CorpActnGnlInf</PlcAndNm>
<EDSMsggElgbltyFlg>true</EDSMsggElgbltyFlg>
<DTCFCPElctnFlg>false</DTCFCPElctnFlg>
<AsstSvcrPrcgFlg>true</AsstSvcrPrcgFlg>
</CorpActnGnlInf>
<UndrlygScty>
<PlcAndNm>/Document/CorpActnNtfctn/CorpActnGnlInf/UndrlygScty</PlcAndNm>
<CtryOfListg>DE</CtryOfListg>
<IncmSrcCtry>JP</IncmSrcCtry>
<DTCAsstClss>CRPB</DTCAsstClss>
<DTCAsstTp>S500</DTCAsstTp>
</UndrlygScty>
<CorpActnDtls>
<PlcAndNm>/Document/CorpActnNtfctn/CorpActnDtls</PlcAndNm>
<CutOffDays>0</CutOffDays>
<EDSMsggCtryCd>JP</EDSMsggCtryCd>
<RDPRefNb>yyyyyyJ54675xxxxxxxxxxxxxxxxxxxx</RDPRefNb>
</CorpActnDtls>
<CorpActnDtDtls>
<PlcAndNm>/Document/CorpActnNtfctn/CorpActnDtls/DtDtls</PlcAndNm>
<DTCPosCaptrDt>0000-04-03</DTCPosCaptrDt>
</CorpActnDtDtls>
<OptnDtls>
<PlcAndNm>/Document/CorpActnNtfctn/CorpActnOptnDtls[1]</PlcAndNm>
<XtndedOptnFeatrs>FORU</XtndedOptnFeatrs>
<DfltOptnFlg>true</DfltOptnFlg>
<RDPRefNb>yyyyyyJ54675xxxxxxxxxxxxxxxxxxxx</RDPRefNb>
</OptnDtls>
<OptnDtls>
<PlcAndNm>/Document/CorpActnNtfctn/CorpActnOptnDtls[2]</PlcAndNm>
<XtndedOptnFeatrs>FORX</XtndedOptnFeatrs>
<RDPRefNb>yyyyyyJ54675xxxxxxxxxxxxxxxxxxxx</RDPRefNb>
</OptnDtls>
<CshMvmntDtls>
<PlcAndNm>/Document/CorpActnNtfctn/CorpActnOptnDtls[1]/CshMvmntDtls[1]</PlcAndNm>
<DTCPayMtd>1</DTCPayMtd>
<DTCPayOrdr>0</DTCPayOrdr>
<NRATaxRptblFlg>false</NRATaxRptblFlg>
<DclrdGrssRate>
<AmtPricPerFinInstrmQty>
<AmtPricTp>ACTU</AmtPricTp>
<PricVal Ccy="USD">25</PricVal>
<FinInstrmQty>
<FaceAmt>1000</FaceAmt>
</FinInstrmQty>
</AmtPricPerFinInstrmQty>
</DclrdGrssRate>
<RDPRefNb>yyyyyyJ54675xxxxxxxxxxxxxxxxxxxx</RDPRefNb>
</CshMvmntDtls>
<CshMvmntDtls>
<PlcAndNm>/Document/CorpActnNtfctn/CorpActnOptnDtls[2]/CshMvmntDtls[1]</PlcAndNm>
<DTCPayMtd>1</DTCPayMtd>
<DTCPayOrdr>0</DTCPayOrdr>
<NRATaxRptblFlg>false</NRATaxRptblFlg>
<RDPRefNb>yyyyyyJ54675xxxxxxxxxxxxxxxxxxxx</RDPRefNb>
</CshMvmntDtls>
<Agt>
<PlcAndNm>/Document/CorpActnNtfctn/Regar/NmAndAdr</PlcAndNm>
<AgtId>00009910</AgtId>
</Agt>
</DTCCCANOCSDDataSD1>
</Document>
</Envlp>
</SplmtryData>
</CorpActnNtfctn>
</Document>
</cdtBusinessData>
</env:Body>
</env:Envelope>
我在提取前几个元素时没有问题 like / env:Envelope / env:Body / cdtBusinessData
cdtBusinessData是主模式中采用xs:any 的元素 。架构片段如下
<xs:element name="cdtBusinessData" form="unqualified">
<xs:complexType>
<xs:sequence>
<xs:any minOccurs="0"/>
</xs:sequence>
</xs:complexType>
</xs:element>
正是从这一点开始,我的xpath查询不会像我期望的那样工作。
即当我尝试/ env:Envelope / env:Body / cdtBusinessData / Document然后它没有将它识别为jxpath上的正确路径。 在为所选节点提供xpath(如xpather / firepath / XpathBuilder)的不同工具上,我得到不同的值,xpath都不接受这些值。
请您帮我理解如何从上面的xml中的两个嵌入节点中提取值。
我已经挣扎了很长一段时间,最后在这里寻求帮助。 如果你能帮助我纠正这条道路,我将不胜感激 的 // ENV:信封/ ENV:车身/ cdtBusinessData / 文档
这是我根据你的建议提出来的。我正在使用 的JXPath 1.3。我在这做错了什么?我在sysout旁边有内联注释,以指示我得到的内容
package com.testbed;
import java.io.ByteArrayInputStream;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.apache.commons.jxpath.JXPathContext;
import com.xyz.ib.pb.dtcc.util.FileUtils;
public class TestJXPathApproach {
public static void main(String a[]) throws Exception {
String xmlMsg = FileUtils.readFileContents("C:\\dtcc-stuff\\SR\\1.xml");
//xmlMsg = StringUtils.remove(xmlMsg, "<?xml version=\"1.0\"?>");
TestJXPathApproach myTest = new TestJXPathApproach();
myTest.testJxPathExpressions(xmlMsg);
}
private void testJxPathExpressions(String xmlMsg) {
org.w3c.dom.Document doc = null;
try {
DocumentBuilder builder = DocumentBuilderFactory.newInstance().newDocumentBuilder();
ByteArrayInputStream bais = new ByteArrayInputStream(xmlMsg.getBytes("UTF8"));
doc = builder.parse(bais);
bais.close();
JXPathContext context = JXPathContext.newContext(doc);
context.setLenient(true);
context.registerNamespace("d", "urn:swift:xsd:seev.031.002.05");
context.registerNamespace("dd", "urn:swift:xsd:supl.001.001.05");
String cdtddTrackingNumVal = (String)context.getValue("/env:Envelope/env:Body/cdtDataDescription/cdtddTrackingNum");
System.out.println("cdtddTrackingNumVal : "+cdtddTrackingNumVal); // prints the value correctly
String cdVal = (String)context.getValue("/env:Envelope/env:Body/cdtBusinessData/d:Document/CorpActnNtfctn/CorpActnGnlInf/EvtTp/Cd");
System.out.println("cdVal : "+cdVal);// prints null with namespace mappping specified
cdVal = (String)context.getValue("/env:Envelope/env:Body/cdtBusinessData/Document/CorpActnNtfctn/CorpActnGnlInf/EvtTp/Cd");
System.out.println("cdVal : "+cdVal);// prints null with no namespace mapping
cdVal = (String)context.getValue("/env:Envelope/env:Body/cdtBusinessData/*:Document/CorpActnNtfctn/CorpActnGnlInf/EvtTp/Cd");
System.out.println("cdVal : "+cdVal);// prints null with wildcard namespace mapping
Object nodeObj = context.selectSingleNode("/env:Envelope/env:Body/cdtBusinessData/d:Document/CorpActnNtfctn");
System.out.println("nodeObj : "+nodeObj);// prints null
}catch(Exception e) {
e.printStackTrace();
}
}
}
答案 0 :(得分:5)
如果您希望能够选择其中一个,请使用名称空间通配符作为文档:
//*:Document
...或者,要在一个查询中获取这两个文档:
/env:Envelope/env:Body/cdtBusinessData/*[local-name()='Document']
查看完整的XQuery文档,您可以自己运行该文档以查看此工作在https://gist.github.com/charles-dyfis-net/983d4054f4f9424a1698
上述版本与XPath 1.0兼容(many thanks to @kjhughes):
//*[local-name() = 'Document']
...或...
con.commit();
答案 1 :(得分:2)
如果您在JXPath中registered以下名称空间前缀
JXPathContext.registerNamespace("sw", "urn:swift:xsd:seev.031.002.05")
JXPathContext.registerNamespace("env", "CDTS-SUBMIT")
然后是以下XPath,
/env:Envelope/env:Body/cdtBusinessData/sw:Document
将成功选择Document
命名空间中的urn:swift:xsd:seev.031.002.05
元素。
如果要在不同的命名空间中选择Document
元素,请为新命名空间注册一个前缀,并在XPath中使用它。
使用注册名称空间前缀通常是首选,但如果您想忽略名称空间,可以在 XPath 2.0 中使用*:Document
技术{{ 3}}
在 XPath 1.0 中,*:
技术无效,但您可以针对元素的本地名称进行测试:
//*[local-name() = 'Document']
将选择所有Document
元素而不管命名空间(无论遗产如何)。