我从HTML文件中提取信息,在Java中使用SAX解析它。解析程序是给我的,它已经在使用SAX,所以我想保持这种方式。 我的工作如下:
问题:使用欧元符号的新字符串,解析库将无法运行。我收到消息:“实体acirc被引用但未声明”
我只想让我的欧元符号不成问题。我如何排序我的东西?
谢谢大家,
答案 0 :(得分:1)
您遇到的问题是编码问题。
管道中的某个工具正在破坏编码,然后向前传输该错误,在输出中创建â
。
从外观上看,该网站使用的是UTF-8(也应该如此),但编码要么是误报,要么是忽略声明。
是否是工具链中导致此问题的工具之一,或者是否滥用工具,并不完全清楚。
答案 1 :(得分:0)
使用HTML编号代替实际的欧元符号€