我正在尝试在 C#中编写一个程序,该程序会将具有多个联系人的vCard(VCF)文件拆分为每个联系人的单个文件。据我所知,vCard需要保存为ANSI(1252)才能让大多数手机读取它们。
但是,如果我使用StreamReader
打开VCF文件,然后使用StreamWriter
(将1252设置为编码格式)将其写回,则所有特殊字符如å
,{{1 }和æ
被写为ø
。当然ANSI(1252)会支持这些字符。我该如何解决这个问题?
编辑:以下是我用来读写文件的代码。
?
答案 0 :(得分:12)
您认为Windows-1252支持上面列出的特殊字符是正确的(有关完整列表,请参阅Wikipedia entry)。
using (var writer = new StreamWriter(destination, true, Encoding.GetEncoding(1252)))
{
writer.WriteLine(source);
}
在我的测试应用程序中使用上面的代码产生了这个结果:
Look at the cool letters I can make: å, æ, and ø!
没有问题可以找到。您是否在使用StreamReader
?
修改强>
您应该只能使用Encoding.Convert
将UTF-8 VCF文件转换为Windows-1252。无需Regex.Replace
。我将如何做到这一点:
// You might want to think of a better method name.
public string ConvertUTF8ToWin1252(string source)
{
Encoding utf8 = new UTF8Encoding();
Encoding win1252 = Encoding.GetEncoding(1252);
byte[] input = source.ToUTF8ByteArray(); // Note the use of my extension method
byte[] output = Encoding.Convert(utf8, win1252, input);
return win1252.GetString(output);
}
以下是我的扩展方法的外观:
public static class StringHelper
{
// It should be noted that this method is expecting UTF-8 input only,
// so you probably should give it a more fitting name.
public static byte[] ToUTF8ByteArray(this string str)
{
Encoding encoding = new UTF8Encoding();
return encoding.GetBytes(str);
}
}