我需要解析一个html文件并将字符“à”转换为
'à'
我的输入文件是:
<html>
<head></head>
<body>
à
</body>
</html>
我的java代码是:
String content = new String(Files.readAllBytes(path), StandardCharsets.UTF_8);
System.out.println(content);
content=content.replace("à","à");
System.out.println(content);
Files.write(path, content.getBytes(StandardCharsets.UTF_8));
此代码打印:
<html>
<head></head>
<body>
à
</body>
</html>
<html>
<head></head>
<body>
à
</body>
</html>
我覆盖了输入文件,但它始终保持不变。 我该如何解决这个问题?
由于
答案 0 :(得分:0)
把它放在你的头部:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
对于html5使用此:
<meta charset="utf-8">