在z#中将zenkaku字符转换为hankaku,反之亦然

时间:2011-06-22 02:51:04

标签: c# string format cjk

正如在标题行中所说,我想将zenkaku字符转换为hankaku字符和C#中的副字符,但无法弄清楚如何做到这一点。所以,说“ラーメン”到“ラーメン”,反之亦然。 是否可以在一个方法中编写它,根据输入的格式自动确定转换需要的方式?

2 个答案:

答案 0 :(得分:2)

您可以通过包含对Microsoft.VisualBasic.dll的引用来使用Strings.StrConv()方法,也可以p /调用LCMapString()本机函数:

private const uint LOCALE_SYSTEM_DEFAULT = 0x0800;
private const uint LCMAP_HALFWIDTH = 0x00400000;

public static string ToHalfWidth(string fullWidth)
{
    StringBuilder sb = new StringBuilder(256);
    LCMapString(LOCALE_SYSTEM_DEFAULT, LCMAP_HALFWIDTH, fullWidth, -1, sb, sb.Capacity);
    return sb.ToString();
}

[DllImport("kernel32.dll", CharSet = CharSet.Unicode)]
private static extern int LCMapString(uint Locale, uint dwMapFlags, string lpSrcStr, int cchSrc, StringBuilder lpDestStr, int cchDest);

你也可以这样做:

private const uint LCMAP_FULLWIDTH = 0x00800000;

public static string ToFullWidth(string halfWidth)
{
    StringBuilder sb = new StringBuilder(256);
    LCMapString(LOCALE_SYSTEM_DEFAULT, LCMAP_FULLWIDTH, halfWidth, -1, sb, sb.Capacity);
    return sb.ToString();
}

至于检测输入字符串的格式,我不知道没有先进行转换并比较结果的简单方法。 (如果字符串包含全角和半角字符,该怎么办?)

答案 1 :(得分:1)

一种方法是编译要转换的所有字符的列表以及它们如何相互映射,然后迭代输入字符串并用等效字符替换列表中的所有字符。

var fullToHalf = new Dictionary<char, char>
{
    ...
    { '\u30E9', '\uFF97' }, // KATAKANA LETTER RA -> HALFWIDTH KATAKANA LETTER RA
    { '\u30EA', '\uFF98' }, // KATAKANA LETTER RI -> HALFWIDTH KATAKANA LETTER RI
    ...
};

var halfToFull = fullToHalf.ToDictionary(kv => kv.Value, kv => kv.Key);

var input = "\u30E9";

var isFullWidth = input.All(ch => fullToHalf.ContainsKey(ch));
var isHalfWidth = input.All(ch => halfToFull.ContainsKey(ch));

var result = new string(input.Select(ch => fullToHalf[ch]).ToArray());
// result == "\uFF97"

Unicode Chart: Halfwidth and Fullwidth Forms (FF00-FFEF)