JSoup不能很好地清理非ascii字符串

时间:2012-08-23 18:06:47

标签: java utf-8 ascii jsoup

我正在使用JSoup来清理用户的传入文本。唉,好像它不支持非ascii字符清理:

assertEquals(“привет”,Jsoup.clean(“привет”,Whitelist.none()));

这不起作用。

有什么想法吗?

1 个答案:

答案 0 :(得分:1)

如果运行代码,默认编码是什么?也许这个不是UTF-8而是linux / windows默认。您可以使用VM参数-Dfile.encoding=UTF8来保存UTF-8。

使用jsoup 1.6.3检查您的代码 - >测试成功