使用正则表达式删除Eclipse中的非utf8字符

时间:2013-01-24 15:18:15

标签: java regex eclipse

有可能在Eclipse中这样做吗?我有很多非utf8字符,如sch ma或propri t (它是法语:))。现在,我正在删除那些角色。如何删除这些字符?

2 个答案:

答案 0 :(得分:0)

这些字符是UTF-8字符集。

文本编码不正确或者您在Eclipse中错误地设置了文件编码。

尝试右击文件 - >属性。然后检查文本文件编码是否设置为UTF-8,如果不是,请选择其他并将其更改为UTF-8。

答案 1 :(得分:0)

我会编写一个读取文件的小程序,删除所有char> 127并写回文件。 [我会将文件名作为命令行参数传递]