对于某些标记,XML解析返回null

时间:2012-07-28 08:13:27

标签: java xml parsing

我试图解析由3ds max和maya生成的一些xml文件。一切正常,但有些值返回null。例如下面的concider(collada与.dae扩展名)xml由max或maya生成,

  <triangles>
   <p>  234 32 4 23 544 35 43 5 435</p>
  </triangles>
  <triangles>
   <p> 43543 45 34 5 12 34 4 36457 6</p>
  </triangles>
  <triangles>
   <p>2345  325 34 543 5 34 534 5 435</p>
  </triangles>

现在,当我使用java代码解析时(如果需要我会提供),

输出结果为:

p has 234 32 4 23 544 35 43 5 435
p has 
p has 2345  325 34 543 5 34 534 5 435 

即使存在值,第二行输出也不显示任何内容。现在,如果我自己编辑行,输出就是预期的,输出如下所示。我在xml文件中给出了自己的值。

编辑过的xml是

 <triangles>
   <p>  234 32 4 23 544 35 43 5 435</p>
  </triangles>
  <triangles>
   <p> 28 234  34 32 4 23 4 23 423  43</p>
  </triangles>
  <triangles>
   <p>2345  325 34 543 5 34 534 5 435</p>
  </triangles>

输出是:

p has 234 32 4 23 544 35 43 5 435
p has 28 234  34 32 4 23 4 23 423  43
p has 2345  325 34 543 5 34 534 5 435 

上面我解释了我面临的问题。 Here您可以找到maya生成的文件。我使用的java代码如下所示。

import java.io.File;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class Main {

    public static void main(String args[]) {        

        try {

            DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
            DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
            Document doc = docBuilder.parse (new File("d://tablemaya.dae"));

            // normalize text representation
            doc.getDocumentElement ().normalize ();
            System.out.println ("Root element of the doc is " + 
                 doc.getDocumentElement().getNodeName());


            NodeList listOfPersons = doc.getElementsByTagName("library_geometries");
            int totalPersons = listOfPersons.getLength();
            System.out.println("Total no of people : " + totalPersons);
            Node firstPersonNode = listOfPersons.item(0);
            if(firstPersonNode.getNodeType() == Node.ELEMENT_NODE){


                Element firstPersonElement = (Element)firstPersonNode;

                //-------
                NodeList geometrylist = firstPersonElement.getElementsByTagName("geometry");
                System.out.println(geometrylist.getLength() + " Geometry size");
                for(int k=0;k<geometrylist.getLength();k++) {
                    Element geometryItr = (Element)geometrylist.item(k);

                    NodeList meshlist = geometryItr.getElementsByTagName("mesh");

                    System.out.println("Mesh length is " + meshlist.getLength());


                    for(int k1=0;k1<meshlist.getLength();k1++) {
                        Element geometryItr1 = (Element)meshlist.item(k1);

                        NodeList meshlist1 = geometryItr1.getElementsByTagName("source");

                        System.out.println("Source length is " + meshlist1.getLength());                        
                    }
                    for(int k2=0;k2<meshlist.getLength();k2++) {
                        Element geometryItr1 = (Element)meshlist.item(k2);

                        NodeList trianglelist = geometryItr1.getElementsByTagName("triangles");

                        //System.out.println("Triangles length is " + trianglelist.getLength());     

                            for(int o=0;o<trianglelist.getLength();o++) {

                                Element trichildnodes = (Element) trianglelist.item(o);
                                NodeList inputs = trichildnodes.getElementsByTagName("input");
                            NodeList p = trichildnodes.getElementsByTagName("p");
                            //System.out.println("Fucking Problem " + p.item(0).getFirstChild().getNodeValue());
                            Element ppp = (Element) p.item(0);
                            //System.out.println("Node Value " + ppp.getNodeValue());
                            System.out.println(inputs.getLength() + "Input length");

                            for(int in=0;in<inputs.getLength();in++) {

                                Element inn = (Element) inputs.item(in);
                                System.out.println(inn.getAttribute("semantic") + " " + inn.getAttribute("source") + " Attributes");

                            }

                            for(int i=0; i<p.getLength(); i++) {
                                Element e = (Element)p.item(i);  
                                String ss = e.getFirstChild().getTextContent();
                                System.out.println("Noide is " + ss);
                            }
                            //System.out.println(p.getLength() +  " P's length" );
                            //System.out.println("P's content " + ppp.getFirstChild().getNodeValue());


                        }


                    }
                    for(int k1=0;k1<meshlist.getLength();k1++) {
                        Element geometryItr1 = (Element)meshlist.item(k1);

                        NodeList meshlist1 = geometryItr1.getElementsByTagName("vertices");

                        System.out.println("Vertices length is " + meshlist1.getLength());                      
                    }


                }

            }


        }catch (Exception err) {
            err.printStackTrace();
        }

    }

}

我无法获取<p>的所有内容。可能是我的代码或xml的问题?请有人帮我这方面。感谢您阅读我的问题。

维奈

3 个答案:

答案 0 :(得分:1)

您的问题是您正在打印第一个节点。

ppp.getFirstChild().getNodeValue()

你可以尝试这样:

ppp.getElementsByTagName("p").getFirstChild().getNodeValue()

这应该可以解决问题。 getFirstChild将取ppp内的第一个节点,这可能是一个文本。

答案 1 :(得分:1)

它可能是一个Eclipse错误。你的代码似乎是正确的,我写了my own XPath demo来测试输入文件。该程序在Eclipse中运行良好,但当我尝试通过<p>输出System.out.println()内容时,第二个<p>不会打印到Eclipse控制台,因为该行有太多字符(超过30K)。请参阅Eclipse bugzilla上的this comment

  

我在Mac上的控制台上发生了奇怪的事情   打印长行,例如:

public static void main(String[] args)
{
    System.out.print("Counting");
    StringBuffer buffer = new StringBuffer();
    for (int i=0; i<28504; i++)
    {
        buffer.append("*");
    }
    System.out.print(" some more");
    System.out.println(buffer);
    System.out.println("Complete");
}
     

我得到的输出如下:

Counting some
Complete
     

即不显示长字符串'*'并覆盖部分字符串   前面的输出

     

史蒂夫

因此文件被成功读取和处理,目标信息被完全收集,只有输出部分失败,但这不取决于你 - 它不会影响程序,因为我不认为你想要的只是正在向用户的眼睛打印一大堆文字

答案 2 :(得分:0)

我没有完全深入研究您的代码,但这似乎更像是一个比您尝试持有它的数据类型更大的问题。

因为43543是最大的价值而且正在被错过。