将UTF-16文件转换为UTF-8的最佳方法是什么?我需要在cmd脚本中使用它。
答案 0 :(得分:20)
还有一个GNU工具recode,您也可以在Windows上使用它。 E.g。
recode utf16..utf8 text.txt
答案 1 :(得分:15)
Ruby的另一种选择是在C#中编写一个小的.NET程序(.NET 1.0会很好,虽然2.0会更简单:) - 这是一个非常简单的代码。您是否希望在没有任何其他应用程序的情况下完成此操作?如果您想要一些代码,请添加注释,我将填写答案......
编辑: 好的,这没有任何错误检查,但是......
using System;
using System.IO;
using System.Text;
class FileConverter
{
static void Main(string[] args)
{
string inputFile = args[0];
string outputFile = args[1];
using (StreamReader reader = new StreamReader(inputFile, Encoding.Unicode))
{
using (StreamWriter writer = new StreamWriter(outputFile, false, Encoding.UTF8))
{
CopyContents(reader, writer);
}
}
}
static void CopyContents(TextReader input, TextWriter output)
{
char[] buffer = new char[8192];
int len;
while ((len = input.Read(buffer, 0, buffer.Length)) != 0)
{
output.Write(buffer, 0, len);
}
}
}
答案 2 :(得分:7)
当然,最简单方式是将脚本加载到记事本中,然后使用UTF-8编码再次保存。这是“另存为”对话框中的一个选项..
答案 3 :(得分:7)
也许是iconv?
答案 4 :(得分:1)
如果您安装了ruby发行版,则可以调用ruby脚本来处理转换:
Ruby script to convert file(s) character encoding
本着同样的精神:Perl script
在没有脚本支持的情况下,您必须使用WideCharToMultiByte()调用来编写此代码C++ source ...
答案 5 :(得分:0)
您可以使用内置的PowerShell cmdlet轻松地做到这一点,您可以从cmd调用它们:
C:\> powershell -c "Get-Content mytext.txt | Set-Content -Encoding utf8 mytext_utf8.txt"