获得标签以及价值观? XML

时间:2016-08-25 17:11:23

标签: java xml split getelementsbytagname

我将以下XML作为String传递。

<?xml version="1.0"?>
 <tagMain>
    <tag1>
      <a>
        <a>1</a>
        <b>2</b>
        <c>3</c>
        <d>4</d>
      </a>
      <b>5</b>
      <c>6</c>
      <d>7</d>
      <e>8</e>
      <f>9</f>
    </tag1>

    <tag2>
        <r>
            <r1>10</r1>
            <r2>11</r2>
            <r3>12</r3>
            <r4>13</r4>
        </r>
        <b>14</b>
        <c>15</c>
        <d>16</d>
        <e>17</e>
        <f>18</f>
    </tag2>

    <tag3>
        <a>
            <a>1m</a>
            <b>2m</b>
            <c>3m</c>
            <d>4m</d>
        </a>
        <b>5m</b>
        <c>6m</c>
        <d>7m</d>
        <e>8m</e>
        <f>9m</f>
    </tag3>
</tagMain>

我调用以下方法,它为每个标记获取值。

public static void  SplitXml(String xml) throws ParserConfigurationException, SAXException, IOException {

        DocumentBuilder builder = DocumentBuilderFactory
                .newInstance().newDocumentBuilder();
        InputSource src = new InputSource();
        src.setCharacterStream(new StringReader(xml));

        Document docu = builder.parse(src);
        String tag1 = docu.getElementsByTagName("tag1").item(0).getTextContent();
        String tag2 = docu.getElementsByTagName("tag2").item(0).getTextContent();
        String tag3 = docu.getElementsByTagName("tag3").item(0).getTextContent();

}

当我运行上面的代码时:

tag1 = "123456789";
tag2 = "101112131415161718";
tag3 = "1m2m3m4m5m6m7m8m9m";

现在回到我的问题,有没有办法可以获得标签以及每个标签内的类似值:

tag1 = "<tag1><a>
            <a>1</a>
            <b>2</b>
            <c>3</c>
            <d>4</d>
          </a>
          <b>5</b>
          <c>6</c>
          <d>7</d>
          <e>8</e>
          <f>9</f>
        </tag1>";

4 个答案:

答案 0 :(得分:2)

使用LSSerializerhttp://docs.oracle.com/javase/8/docs/api/index.html?org/w3c/dom/ls/LSSerializer.html)或从Transformer创建默认TransformerFactory,然后您可以使用它来序列化DOM节点,传入{{ 1}}到DOMSource方法(https://docs.oracle.com/javase/7/docs/api/javax/xml/transform/Transformer.html#transform(javax.xml.transform.Source,%20javax.xml.transform.Result)和StringWriter来收集结果。

答案 1 :(得分:1)

我不确定此功能是否已存在,但您可以编写一个简单的帮助方法:

private static String getWrappedTag(String tag, Document doc) {
  StringBuilder sb = new StringBuilder();
  sb.append("<" + tag + ">");
  sb.append(doc.getElementsByTagName(tag).item(0).getTextContent());
  sb.append("</" + tag + ">");
  return sb.toString();
}

并称之为:

String tag1 = getWrappedTag("tag1", doc);

答案 2 :(得分:1)

这是一段非常简单的XPath和VTD-XML代码

import com.ximpleware.*;
import java.io.*;
public class splitXML {
    public static void main(String[] args) throws VTDException, IOException {
        VTDGen vg = new VTDGen();
        if (!vg.parseFile("d:\\xml\\input.xml", false)){
            System.out.println("error");
            return;
        }
        VTDNav vn = vg.getNav();
        AutoPilot ap = new AutoPilot(vn);
        ap.selectXPath("/tagmain/*");
        int i=0,n=0;
        FileOutputStream fos =null;
        while((i=ap.evalXPath())!=-1){
            fos = new FileOutputStream("d:\\xml\\output"+(++n)+".xml");
            long l = vn.getElementFragment();
            fos.write(vn.getXML().getBytes(), (int)l, (int)(l>>32));
            fos.close();
        }
    }
}

答案 3 :(得分:1)

感谢大家的投入。

因为,每次调用该方法时,XML都将具有相同的标记名称,意思是标记1-4。所以,我采取了这种方法......

    public String split(String xml, String tagName1, String tagName2)
   {
       String splitedXML = xml.substring((xml.indexOf(tagName1)), xml.indexOf(tagName2));

       return splitedXML;
   }

现在我将这个方法称为拆分tag1,tag2,tag3值的方法:

    String tag1 = split(XMLString, "<tag1>", "<tag2>"));
    String tag2 = split(XMLString, "<tag2>", "<tag3>"));
    String tag3 = split(XMLString, "<tag3>", "<tag4>"));