扩展的字符集字符无法识别并转换为?标记

时间:2013-01-18 01:11:34

标签: utf-8 latin1

我有一个包含一些特殊字符串的字符串,例如“\ u2012”,即图DASH。当我试图在控制台上打印时,我得到一个'?'标记而不是它的符号。我有一个编辑器,我可以使用alt + numpad插入符号,如alt + 2012。在编辑器中我可以看到符号将其保存在xml文件中并使用nodevalue获取值,我得到一个'?'马克。
总结一下,我正面临着阅读扩展拉丁语的问题。我需要的是当我插入这样的符号并阅读它时,我应该得到像& #xXXXX;这样的东西。 请帮忙!

TIA:)

我只有一个字符串inpath =“À”;,我希望得到它的unicode值.. like& #xXXXX;

1 个答案:

答案 0 :(得分:0)

Windows中的默认控制台编码是某些MS-DOS代码页,它们不支持该字符。您可以在运行程序之前尝试运行chcp 65001,但您可能还需要更改控制台字体。

只要您使用UTF-8,就不需要对任何其他角色执行任何操作。你不是在很多地方都这样做的。您需要在代码中明确写入以UTF-8保存和读取文件,而不是依赖于平台默认编码。