来自url的Java utf-8编码

时间:2011-10-29 13:22:43

标签: java encoding utf-8 urlconnection

我对UTF-8编码中的某些符号有疑问。 我正在从http://wordki.pl阅读index.html以获取带有名称的单词列表。

看起来像这样

<a href="THE LINK.html">THE NAME</a><span>(20)</span><img src="krecha.png">

当名字有“Ł”时,它就会发挥作用并把它放在那里“??”但是“??”不是我可以用replaceAll(“str”,“str”)更改的标志,因为我的控制台只是显示隐藏在它后面的字符。

但是当我在chrome / firefox等中查看源代码时,它会显示“Ł”。 所有其他有趣的标志,如“ó,ł,±,ś”在我的节目中运作良好。

所以我问是否有办法改变“??”变成“Ł”?我尝试逐字节编码,但后来我失去了所有其他标志,如“ó,ł,±”等。

编辑:好的,我已经解决了问题 我需要将我的* .java文件保存为UTF-8:O

1 个答案:

答案 0 :(得分:0)

您应将内容类型设置为 "UTF-8"

做这样的事情:

request.getCharacterEncoding() = ISO-8859-1 
response.getCharacterEncoding() = UTF-8 
request.getParameter("query") = déjeuner

OR

  if(null == request.getCharacterEncoding())       
     request.setCharacterEncoding(encoding); 

  response.setContentType("text/html; charset=UTF-8");  
  response.setCharacterEncoding("UTF-8");

请参阅此网址以获取更多信息:

<强> How to get UTF-8 working in Java webapps?

<meta http-equiv="Content-Type" content="text/html;charset=utf-8">