UTF-16到UTF-8转换(用于Windows中的脚本)

时间:2008-11-05 14:54:56

标签: windows utf-8 batch-file cmd utf-16

将UTF-16文件转换为UTF-8的最佳方法是什么?我需要在cmd脚本中使用它。

6 个答案:

答案 0 :(得分:20)

还有一个GNU工具recode,您也可以在Windows上使用它。 E.g。

recode utf16..utf8 text.txt

答案 1 :(得分:15)

Ruby的另一种选择是在C#中编写一个小的.NET程序(.NET 1.0会很好,虽然2.0会更简单:) - 这是一个非常简单的代码。您是否希望在没有任何其他应用程序的情况下完成此操作?如果您想要一些代码,请添加注释,我将填写答案......

编辑: 好的,这没有任何错误检查,但是......

using System;
using System.IO;
using System.Text;

class FileConverter
{
  static void Main(string[] args)
  {
    string inputFile = args[0];
    string outputFile = args[1];
    using (StreamReader reader = new StreamReader(inputFile, Encoding.Unicode))
    {
      using (StreamWriter writer = new StreamWriter(outputFile, false, Encoding.UTF8))
      {
        CopyContents(reader, writer);
      }
    }
  }

  static void CopyContents(TextReader input, TextWriter output)
  {
    char[] buffer = new char[8192];
    int len;
    while ((len = input.Read(buffer, 0, buffer.Length)) != 0)
    {
      output.Write(buffer, 0, len);
    }
  }
}

答案 2 :(得分:7)

当然,最简单方式是将脚本加载到记事本中,然后使用UTF-8编码再次保存。这是“另存为”对话框中的一个选项..

答案 3 :(得分:7)

也许是iconv

答案 4 :(得分:1)

如果您安装了ruby发行版,则可以调用ruby脚本来处理转换:

Ruby script to convert file(s) character encoding

本着同样的精神:Perl script

在没有脚本支持的情况下,您必须使用WideCharToMultiByte()调用来编写此代码C++ source ...

答案 5 :(得分:0)

您可以使用内置的PowerShell cmdlet轻松地做到这一点,您可以从cmd调用它们:

C:\> powershell -c "Get-Content mytext.txt | Set-Content -Encoding utf8 mytext_utf8.txt"