我想将包含xml的java字符串转换为w3c dom文档对象。
我首先搜遍了整个地方,并在stackoverflow上找到了一些很好的例子。 但遗憾的是,我可以让他们工作!
显然我的代码不能100%正常工作。
它似乎解析了字符串,但节点中没有值。 这就是我到目前为止所得到的!
Document newDoc = null;
InputSource is = new InputSource();
is.setCharacterStream(new StringReader(TestFiles.RSS_FEED_FILE_2));
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setNamespaceAware(true);
DocumentBuilder builder = null;
builder = factory.newDocumentBuilder();
newDoc = builder.parse(is);
之后我像这样做一个sysout:
System.out.println(newDoc.getDocumentElement().getElementsByTagName("channel").item(0)
.getNodeValue());
使用此sysout时输出为null:
System.out.println(newDoc.getDocumentElement().getElementsByTagName("channel").item(0));
我得到了输出:[channel:null]
所以我有一个对象,否则会抛出一些空指针异常,但它内部不包含任何值?!
常量的内容是:
public final static String RSS_FEED_FILE_2 = "<?xml version=\"1.0\" encoding=\"UTF-8\"?>\n" +
"<rss version=\"2.0\">\n" +
"<channel>\n" +
"<title>sunday</title>\n" +
"<link>http://www.google.nl</link>\n" +
"<pubDate>2012-02-05 20:58</pubDate>\n" +
"<lastBuildDate>2012-02-08 09:48</lastBuildDate>\n" +
"<description>blabla </description>\n" +
"<item>\n" +
"<title><![CDATA[title]]></title>\n" +
"<link><![CDATA[http://www.google.nl]]></link>\n" +
"<guid><![CDATA[2266610]]></guid>\n" +
"<source><![CDATA[sunday]]></source>\n" +
"<author><![CDATA[me]]></author>\n" +
"<description><![CDATA[blalbalavblabllllll!]]></description>\n" +
"</item>\n" +
"</channel>\n" +
"</rss>";
有人有解决方案或提示吗?
答案 0 :(得分:2)
这是一个非常普遍的问题。 getNodeValue()
的行为取决于Node的子类。对于Element
,getNodeValue()
将始终返回null
(有关其他子类的行为,请参阅Node
javadoc中的表格。
如果要调试XML文档,请考虑使用getTextContent()
。
答案 1 :(得分:1)
当您尝试加载RSS XML字符串时,我建议您使用http://www.thearchitect.co.uk/schemas/rss-2_0.xsd中的RSS XSD。这将帮助您加载RSS字符串,并为您提供更好的方法来编辑数据或将其转换为任何目标,如文件。这需要JAXB才能工作。希望这会有所帮助。
答案 2 :(得分:0)
使用jdom需要花费大量精力处理XML,这通常是我的第一个停靠点。
如果使用jdom是一个选项,那么构建文档是微不足道的。
SAXBuilder builder = new SAXBuiler();
Document doc = builder.build(new StringReader(YOUR_XML_STRING));
需要注意的是,这会创建一个org.jdom.Document对象,然后您需要将其调整为w3c文档。同样,使用org.jdom.output.DOMOutputter
类很容易实现这一点。