我有一个包含一些特殊字符串的字符串,例如“\ u2012”,即图DASH。当我试图在控制台上打印时,我得到一个'?'标记而不是它的符号。我有一个编辑器,我可以使用alt + numpad插入符号,如alt + 2012。在编辑器中我可以看到符号将其保存在xml文件中并使用nodevalue获取值,我得到一个'?'马克。
总结一下,我正面临着阅读扩展拉丁语的问题。我需要的是当我插入这样的符号并阅读它时,我应该得到像& #xXXXX;这样的东西。
请帮忙!
TIA:)
我只有一个字符串inpath =“À”;,我希望得到它的unicode值.. like& #xXXXX;
答案 0 :(得分:0)
Windows中的默认控制台编码是某些MS-DOS代码页,它们不支持该字符。您可以在运行程序之前尝试运行chcp 65001
,但您可能还需要更改控制台字体。
只要您使用UTF-8,就不需要对任何其他角色执行任何操作。你不是在很多地方都这样做的。您需要在代码中明确写入以UTF-8保存和读取文件,而不是依赖于平台默认编码。