Java:如何使用常规短划线和引号替换棘手/花哨的短划线和引号

时间:2012-07-07 23:34:43

标签: regex unicode utf-8 replace ascii

  

可能重复:
  Replacing unicode punctuation with ASCII approximations

我认为我可以完全责怪微软,但是我的数据库中存储了一些字符串,并且这些破折号和引号不是正常的破折号和引号。我认为他们想要聪明或者其他什么......

它在页面上显示得很好,但是我需要将它作为ASCII发送到另一个程序。

我已经看过这个问题Convert Unicode to ASCII without changing the string length (in Java),特别是@Denis Tulskiy回答,但它将花哨的破折号变成了问号,而不是普通的破折号。如何修改它以处理这几个字符?

1 个答案:

答案 0 :(得分:0)

只需将这些花哨的字符替换为您认为更合适且具有ASCII表示的字符。最后调用String.getBytes("ASCII")以获得所需的编码。