将代码页的代码源转换为UTF-8的工具?

时间:2009-02-06 19:00:14

标签: unicode utf-8 codepages

我正在开发一个开源项目。原始项目包含俄语注释,并使用代码页1251.我使用代码页1252并且俄语注释在Visual Studio Express 2008中无法正确显示,不是很好但无论如何我无法阅读俄语。使用代码页950(繁体中文)的人试图编译项目并且由于代码页而无法执行此操作!现在真的很烦人。

我认为使用unicode (and more exactly UTF-8 with signature) as file format for the code source是可行的方法。

问题:如何轻松转换整个源代码?

我已经说过了:

  • 让Visual Studio将源代码保存为UTF-8。但是:我的计算机正在使用代码页1252,我发现无法告诉VS原始代码源使用代码页1251,因此转换将不正确。

    编辑:正如“LicenseQ”所指出的,有一种方法可以在VS中使用其他编码打开单个文件:在打开对话框中单击“打开”按钮旁边的箭头,选择“打开方式”,然后选择“代码编辑器(带编码)”。

  • 当然,我可以在转换时更改计算机的代码页。但它是Windows中的全局设置,您需要重新启动计算机才能找到更友好的解决方案。

  • 我找到了一个名为CodePageConverter的工具,它可以完全满足我的需求,但不能将其作为批处理作业。

有没有人知道从代码页转换为UTF-8的另一个工具(命令行工具会很完美)?

编辑:正如tkotitan建议的那样iconv是我正在寻找的解决方案。有一个windows version of iconv。现在我知道了这个工具的名称,我能够找到over posts on stackoverflow来处理类似的问题。

2 个答案:

答案 0 :(得分:7)

在unix世界中,该实用程序称为iconv。

不确定是否有等效的Windows。

答案 1 :(得分:2)

您可以要求VS 2008打开带编码的文件(单击打开对话框中的“打开”按钮旁边的箭头)

或者您可以更改区域设置以添加俄语区域作为默认值;)