我已使用此Java NIO从Google方向下载xml文件。
在IE中打开的screenshot xml文件。这是它应该看起来正确的另一个screenshot。
由于某些原因,似乎无法识别 标记,因此当我使用xPath来评估和查询XML文件时,我得到如下输出:
Continue onto <b>Derwent St</b>
338
0.3 km
At the roundabout, take the <b>1st</b> exit onto <b>Corporation St</b>
102
0.1 km
有没有更简单的方法来解决这个问题,还是我必须使用SAX解析器?
答案 0 :(得分:1)
<b>
显示为数据而不是标记。它将表示为<b>
或出现在CDATA块中。
即。 XML包含HTML片段作为数据。它不包括命名空间的XHTML。
输出是你应该期待的。
下一步取决于你想要达到的目标。无论是什么,您需要将数据作为字符串(而不是textNode)获取,并将该字符串视为HTML而不是文本。
如果要查询HTML,则需要先通过HTML解析器运行它。