与“nbsp”相关的Xpath错误

时间:2011-03-04 11:51:58

标签: java xml parsing

使用XPATH解析我的html页面时出现此错误..我也在使用HTMLcleaner

enter image description here

如果不清楚我甚至可以发布我的java代码和HTML代码

1 个答案:

答案 0 :(得分:5)

原始输入是HTML,您将其视为XML。 XML具有比HTML has更少的预定义实体。要么使用HTML解析器,要么在XML解析器中声明实体 ,要么在文本中用原始输入中的 替换