连字符更改为特殊字符–

时间:2018-06-22 09:56:40

标签: linux unix

我有一个来自Oracle融合文件,名称为Hyderabad-Telangana

当我收到此消息给服务器时,连字符已成为特殊字符–。

我们正在对此值使用查找,但由于特殊字符而失败。

我已将文档下载到本地驱动器,并且可以正确看到连字符。

我试图寻找解决方案,其中大多数都说这是由于编码问题。

如何在Unix中查找文件的编码?

1 个答案:

答案 0 :(得分:0)

因为它不是普通的连字符,而是EN DASH,Unicode U + 2013。当以UTF-8编码时,它变成"\xe2\x80\x93"。第一个字节是'â'的代码,它将我带到该路径。

有趣的是,另外两个其他字符由cp1252字符集处理,这在西欧语言Windows版本中很常见,分别是:

Byte      Character in cp1252 charset      Unicode code         Name
0x80             €                            U+20AC            EURO SIGN
0x93             “                            U+201C            LEFT DOUBLE QUOTATION MARK