将文本文件的编码从ANSI更改为UTF8,而不会影响C#中文件的任何字符!

时间:2012-04-24 11:04:21

标签: c# windows

任何人都可以帮助我吗?我尝试了很多不同的方法,但是我没有运气得到理想的结果。我只想将现有文本[.txt]文件的编码从ANSI更改为UTF8,其中包含类似ö,ü等字符。当我通过在编辑模式下打开该文本文件然后FILE => SAVE AS手动执行此操作时,它在编码列表中显示ANSI。使用它,我能够将其编码从ANSI更改为UTF8,并且在这种情况下它不会更改任何内容/字符。但是在使用CODE时,它无法正常工作。

==>第一种方式我曾经通过遵循代码来实现这一目标:

if (!System.IO.Directory.Exists(System.Windows.Forms.Application.StartupPath + "\\Temp"))
{
    System.IO.Directory.CreateDirectory(System.Windows.Forms.Application.StartupPath + "\\Temp");
}
string destPath = System.Windows.Forms.Application.StartupPath + "\\Temp\\temporarytextfile.txt";

File.WriteAllText(destPath, File.ReadAllText(path, Encoding.Default), Encoding.UTF8);

==>我使用的第二种选择:

using (Stream fileStream = new FileStream(path, FileMode.Open, FileAccess.Read, FileShare.ReadWrite))
{
    using (Stream destStream = new FileStream(destPath, FileMode.Create, FileAccess.Write, FileShare.ReadWrite))
    {
        using (var reader = new BinaryReader(fileStream, Encoding.Default))
        {
            using (var writer = new BinaryWriter(destStream, Encoding.UTF8))
            {
                var srcBytes = new byte[fileStream.Length];
                reader.Read(srcBytes, 0, srcBytes.Length);
                writer.Write(srcBytes);

            }
        }
    }
}

==>我使用的第三种选择:

System.IO.StreamWriter file = new System.IO.StreamWriter(destPath, true, Encoding.Default);
using (StreamReader sr = new StreamReader(path, Encoding.UTF8, true))
{
    String line1;
    while ((line1 = sr.ReadLine()) != null)
    {
        file.WriteLine(line1);
    }
}

file.Close();

但不幸的是,上述解决方案都不适合我。

3 个答案:

答案 0 :(得分:6)

ANSI的问题在于它不是特定的编码,它只是“某些8位编码的术语,它是创建它的系统的默认编码”。

如果文件是在同一系统上创建的,并且默认编码没有更改,您可以使用Encoding.Default来读取它,这样您的第一个和第三个版本就可以正常工作。 (您的第二个版本只是复制文件而不做任何更改。)否则您必须确切知道使用了哪种编码。

此示例使用windows-1250代码页:

File.ReadAllText(path, Encoding.GetEncoding(1250))

有关可用编码的列表,请参阅Encoding class的文档。

答案 1 :(得分:1)

我有同样的需要。以下是我的进展:

    int Encode(string file, Encoding encode)
    {
        int retour = 0;
        try
        {
            using (var reader = new StreamReader(file))
            {
                if (reader.CurrentEncoding != encode)
                {
                    String buffer = reader.ReadToEnd();
                    reader.Close();
                    using (StreamWriter writer = new System.IO.StreamWriter(file, false, encode))
                    {
                        writer.Write(buffer);
                        writer.Close();
                    }
                    message = string.Format("Encode {0} !", file);
                    retour = 2;
                }
                else retour = 1;
            }
        }
        catch(Exception e)
        {
            message = string.Format("{0} ?", e.Message);
        }
        return retour;
    }

    /// <summary>
    /// Change encoding to UTF8
    /// </summary>
    /// <param name="file"></param>
    /// <returns></returns>
    public int toUTF8(string file)
    {
        return Encode(file, Encoding.UTF8);
    }

    public int toANSI(string file)
    {
        return Encode(file, Encoding.Default);
    }

答案 2 :(得分:-1)

你试过以下的事情:

http://msdn.microsoft.com/en-us/library/system.text.encoding.convert%28v=vs.71%29.aspx

using System;
using System.Text;
namespace ConvertExample
{
   class ConvertExampleClass
   {
      static void Main()
      {
         string unicodeString = "This string contains the unicode character Pi(\u03a0)";

         // Create two different encodings.
         Encoding ascii = Encoding.ASCII;
         Encoding unicode = Encoding.Unicode;

         // Convert the string into a byte[].
         byte[] unicodeBytes = unicode.GetBytes(unicodeString);

         // Perform the conversion from one encoding to the other.
         byte[] asciiBytes = Encoding.Convert(unicode, ascii, unicodeBytes);

         // Convert the new byte[] into a char[] and then into a string.
         // This is a slightly different approach to converting to illustrate
         // the use of GetCharCount/GetChars.
         char[] asciiChars = new char[ascii.GetCharCount(asciiBytes, 0, asciiBytes.Length)];
         ascii.GetChars(asciiBytes, 0, asciiBytes.Length, asciiChars, 0);
         string asciiString = new string(asciiChars);

         // Display the strings created before and after the conversion.
         Console.WriteLine("Original string: {0}", unicodeString);
         Console.WriteLine("Ascii converted string: {0}", asciiString);
      }
   }
}