Linux xml解析

时间:2018-11-27 16:20:48

标签: xml linux xml-parsing xmllint

我正在尝试使用xmllint解析xml文件的一部分,但无法使其正常工作。

这是我感兴趣的部分:

    <?xml version="1.0" encoding="UTF-8"?>
<S2SCTIcf:SCTIcfBlkCredTrf xmlns:S2SCTIcf="urn:S2SCTIcf:xsd:$SCTIcfBlkCredTrf" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="urn:S2SCTIcf:xsd:$SCTIcfBlkCredTrf SCTIcfBlkCredTrf.xsd">
  <S2SCTIcf:SndgInst>AAAAAAAA</S2SCTIcf:SndgInst>
  <S2SCTIcf:RcvgInst>BBBBBBBB</S2SCTIcf:RcvgInst>
  <S2SCTIcf:FileRef>ISCT181127000006</S2SCTIcf:FileRef>
  <S2SCTIcf:SrvcId>SCT</S2SCTIcf:SrvcId>
  <S2SCTIcf:TstCode>T</S2SCTIcf:TstCode>
  <S2SCTIcf:FType>ICF</S2SCTIcf:FType>
  <S2SCTIcf:FDtTm>2018-11-27T17:01:41.198+00:00</S2SCTIcf:FDtTm>
  <S2SCTIcf:NumCTBlk>1</S2SCTIcf:NumCTBlk>
  <S2SCTIcf:NumPCRBlk>0</S2SCTIcf:NumPCRBlk>
  <S2SCTIcf:NumRFRBlk>0</S2SCTIcf:NumRFRBlk>
  <S2SCTIcf:NumROIBlk>0</S2SCTIcf:NumROIBlk>
  <S2SCTIcf:NumSRBlk>0</S2SCTIcf:NumSRBlk>
  <S2SCTIcf:FIToFICstmrCdtTrf xmlns="urn:iso:std:iso:20022:tech:xsd:pacs.008.001.02">

例如,是否有一种方法可以从标签<S2SCTIcf:FDtTm>中获取值?我应该逃脱:标志吗?

1 个答案:

答案 0 :(得分:2)

冒号前的内容是名称空间前缀。您需要注册名称空间并在XPath表达式中使用它:

setns s=urn:S2SCTIcf:xsd:$SCTIcfBlkCredTrf
cat //s:FDtTm/text()

因此,整个脚本可能类似于

#!/bin/bash

ext=$(cat <<'EOF'                    \
          | xmllint --shell file.xml \
          | grep -A1 -- '-------'    \
          | tail -n1
setns s=urn:S2SCTIcf:xsd:$SCTIcfBlkCredTrf
cat //s:FileRef/text()
EOF
)
echo "$ext"