从C#字符串检测使用的书写系统

时间:2019-01-28 15:34:51

标签: c# text unicode

考虑用户提供的输入字符串,其中至少包含一个书写系统中的至少一个字符(例如,拉丁文,西里尔文,希腊文,阿拉伯文,希伯来文,中文,日文,韩文...)

是否可以检测使用了哪种书写系统?我是否必须先进行一些Unicode解码,然后再进行Unicode页面,或者是否有某些功能对我有用?

2 个答案:

答案 0 :(得分:0)

您可以尝试使用Google API来检测语言:here

所有积分以及如何使用它们here

答案 1 :(得分:0)

尝试使用类似的扩展名进行Unicode检查

public static class StringExtension
{
    public static bool IsUnicodeCharacterInIt(this string value)
    {
        return value.Any(c => c > 255);
    }
}

public void Check()
{
    var unicodeString = "سلام بیبی";
    var nonUnicodeString = "hi baby";

    var result1 = unicodeString.IsUnicodeCharacterInIt();
    var result2 = nonUnicodeString.IsUnicodeCharacterInIt();
}