我正在使用JSoup来清理用户的传入文本。唉,好像它不支持非ascii字符清理:
assertEquals(“привет”,Jsoup.clean(“привет”,Whitelist.none()));
这不起作用。
有什么想法吗?
答案 0 :(得分:1)
如果运行代码,默认编码是什么?也许这个不是UTF-8而是linux / windows默认。您可以使用VM参数-Dfile.encoding=UTF8
来保存UTF-8。
使用jsoup 1.6.3检查您的代码 - >测试成功