我有一个来自Oracle融合文件,名称为Hyderabad-Telangana
当我收到此消息给服务器时,连字符已成为特殊字符–。
我们正在对此值使用查找,但由于特殊字符而失败。
我已将文档下载到本地驱动器,并且可以正确看到连字符。
我试图寻找解决方案,其中大多数都说这是由于编码问题。
如何在Unix中查找文件的编码?
答案 0 :(得分:0)
因为它不是普通的连字符,而是EN DASH,Unicode U + 2013。当以UTF-8编码时,它变成"\xe2\x80\x93"
。第一个字节是'â'
的代码,它将我带到该路径。
有趣的是,另外两个其他字符由cp1252
字符集处理,这在西欧语言Windows版本中很常见,分别是:
Byte Character in cp1252 charset Unicode code Name
0x80 € U+20AC EURO SIGN
0x93 “ U+201C LEFT DOUBLE QUOTATION MARK