替换html的特殊字符

时间:2015-08-20 18:04:13

标签: java

我需要解析一个html文件并将字符“à”转换为

'à'

我的输入文件是:

<html>
 <head></head> 
 <body>
   à  
 </body>
</html>

我的java代码是:

String content = new String(Files.readAllBytes(path), StandardCharsets.UTF_8);
System.out.println(content);
content=content.replace("à","&agrave;");
System.out.println(content);
Files.write(path, content.getBytes(StandardCharsets.UTF_8));

此代码打印:

<html>
 <head></head> 
 <body>
   à  
 </body>
</html>
<html>
 <head></head> 
 <body>
   &agrave;  
 </body>
</html>

我覆盖了输入文件,但它始终保持不变。 我该如何解决这个问题?

由于

1 个答案:

答案 0 :(得分:0)

把它放在你的头部:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

对于html5使用此:

<meta charset="utf-8">