字符替换批处理文件

时间:2014-10-22 08:38:26

标签: windows batch-file replace cmd cyrillic

我正在尝试使用Windows命令行执行批处理脚本来转换某些字符,例如:

É to Й
Ö to Ц
Ó to У
Ê to К
Å to Е
Í to Н
à to Г
Ø to Ш
Ù to Щ
Ç to З

没有成功。那是因为我使用的程序不支持西里尔字体。

我已经有了这些文件的文件,例如:

ОБОГРЕВ ЗОНЫ  1
ДАВЛЕНИЕ ЦВЕТА 1
...
and so on...

有可能吗?

1 个答案:

答案 0 :(得分:0)

我猜你想转换一个文件的字符集(别名代码页),这样你就可以打开并阅读它了。 我假设您使用的是Windows计算机。

假设您的文件是 russian.txt ,当您使用记事本打开它时,这些字符没有任何意义。 russian.txt 文件的字符编码最可靠的是ANSI,它的代码页是Windows-1251。 关于字符编码的一些话:

  • 在ANSI中,一个字符长一个字节。
    • 不同的语言有不同的代码页:Windows-1251 =俄语,Windows-1252 =西方语言(英语,德语,瑞典语......),Windows-1253 =希腊语......
  • 在UTF-8中,英文字符长一个字节,非英文字符长两个字节。
  • 在Unicode中,所有字符都是两个字节长。
  • UTF-8和Unicode不需要代码页。

您可以通过在记事本中打开文件并单击文件,另存为来检查编码。在“保存”按钮旁边的右下角,您可以看到编码。

通过一些谷歌搜索,我找到了一个网站,您可以在线进行字符编码转换。我没有测试过,但这里是地址:

我制作了一个脚本(=一个小程序),它将字符编码从任何ANSI和代码页组合更改为UTF-8或Unicode,反之亦然。

假设您拥有英语Windows计算机,并希望将 russian.txt (ANSI / Windows-1251)转换为UTF-8。 方法如下:

  • 打开此网页并将其中的脚本复制到剪贴板:
  • 创建一个名为ConvertCharset.vbs的新文件到同一个文件夹,其中 russian.txt 就是C:\ Temp。
  • 在记事本中打开ConvertCharset.vbs(右键单击+编辑)并粘贴。
  • 打开CMD(Windows按钮+ R,cmd,回车)。
  • 在CMD窗口类型中(在该行的每一端按Enter键):

cd C:\Temp\ cscript ConvertCharset.vbs /InputCharset:Windows-1251 /OutputCharset:utf-8 /InputFile:russian.txt /OutputFile:russian_utf-8.txt

现在你可以在记事本中打开russian_utf-8.txt,你会看到俄语字符OK。

更多信息: