将vcards转换为Windows-1252

时间:2010-12-04 04:45:06

标签: c# .net unicode character-encoding windows-1252

我正在尝试在 C#中编写一个程序,该程序会将具有多个联系人的vCard(VCF)文件拆分为每个联系人的单个文件。据我所知,vCard需要保存为ANSI(1252)才能让大多数手机读取它们。

但是,如果我使用StreamReader打开VCF文件,然后使用StreamWriter(将1252设置为编码格式)将其写回,则所有特殊字符如å,{{1 }和æ被写为ø。当然ANSI(1252)会支持这些字符。我该如何解决这个问题?

编辑:以下是我用来读写文件的代码。

?

1 个答案:

答案 0 :(得分:12)

您认为Windows-1252支持上面列出的特殊字符是正确的(有关完整列表,请参阅Wikipedia entry)。

using (var writer = new StreamWriter(destination, true, Encoding.GetEncoding(1252)))
{
    writer.WriteLine(source);
}

在我的测试应用程序中使用上面的代码产生了这个结果:

Look at the cool letters I can make: å, æ, and ø!

没有问题可以找到。您是否在使用StreamReader

阅读时设置了编码

修改 您应该只能使用Encoding.Convert将UTF-8 VCF文件转换为Windows-1252。无需Regex.Replace。我将如何做到这一点:

// You might want to think of a better method name.
public string ConvertUTF8ToWin1252(string source)
{
    Encoding utf8 = new UTF8Encoding();
    Encoding win1252 = Encoding.GetEncoding(1252);

    byte[] input = source.ToUTF8ByteArray();  // Note the use of my extension method
    byte[] output = Encoding.Convert(utf8, win1252, input);

    return win1252.GetString(output);
}

以下是我的扩展方法的外观:

public static class StringHelper
{
    // It should be noted that this method is expecting UTF-8 input only,
    // so you probably should give it a more fitting name.
    public static byte[] ToUTF8ByteArray(this string str)
    {
        Encoding encoding = new UTF8Encoding();
        return encoding.GetBytes(str);
    }
}

你也可能想要add usings to your ReadFile and WriteFile methods.