RegExp自然排序问题

时间:2012-11-07 19:43:51

标签: c# regex sorting

我正在开发一个需要显示自然排序的不同信息列的应用程序。前段时间我发现this文章有很好的描述和代码。我修改了一些,因为我们的列也显示日期并最终得到:

public class NaturalComparer : Comparer<string>, IDisposable
{
    private Dictionary<string, string[]> table;

    public NaturalComparer()
    {
        table = new Dictionary<string, string[]>();
    }

    public void Dispose()
    {
        table.Clear();
        table = null;
    }

    public override int Compare(string x, string y)
    {
        if (x == y)
        {
            return 0;
        }

            DateTime xValueD, yValueD;
            if (DateTime.TryParse(x, out xValueD) && DateTime.TryParse(y, out yValueD))
                return xValueD.CompareTo(yValueD);


        string[] x1, y1;
        if (!table.TryGetValue(x, out x1))
        {
            x1 = Regex.Split(x.Replace(" ", ""), "([0-9]+)");
            table.Add(x, x1);
        }
        if (!table.TryGetValue(y, out y1))
        {
            y1 = Regex.Split(y.Replace(" ", ""), "([0-9]+)");
            table.Add(y, y1);
        }

        for (int i = 0; i < x1.Length && i < y1.Length; i++)
        {
            if (x1[i] != y1[i])
            {
                return PartCompare(x1[i], y1[i]);
            }
        }
        if (y1.Length > x1.Length)
        {
            return 1;
        }
        else if (x1.Length > y1.Length)
        {
            return -1;
        }
        else
        {
            return 0;
        }
    }

    private static int PartCompare(string left, string right)
    {
        int x, y;
        if (!int.TryParse(left, out x))
        {
            return left.CompareTo(right);
        }

        if (!int.TryParse(right, out y))
        {
            return left.CompareTo(right);
        }

        return x.CompareTo(y);
    }
}

现在它还需要处理一种特殊类型的字符串数据,而它不是我们需要的。字符串显示数据范围的信息,它们如下所示:

string[] list = { "Empty Values","x<0" , "1000.0 < x <=1500.0", "900.0 < x <= 1000.0","3000.0 < x <= 3500.0", "800.0 < x <=900.0" };

排序它应该如下:

x < 0
800.0 < x <= 900.0
900.0 < x <= 1000.0
1000.0 < x <= 1500.0
3000.0 < x <= 3500.0
Empty Values

然而,它最终得到:

800.0 < x <= 900.0
900.0 < x <= 1000.0
1000.0 < x <= 1500.0
3000.0 < x <= 3500.0
Empty Values
x < 0

所以,从逻辑上讲,我认为它正在做它的设计目的,因为它选择了基于此的字母和排序。我想继续用正则表达式搜索,因为它很快。但是,我不知道如何设置它们以便正确搜索和排序。任何想法,帮助,阅读或代码将不胜感激。 感谢

1 个答案:

答案 0 :(得分:1)

使用正则表达式

^\D*(\d+(?:\.\d*)?)
匹配的

和组#1应该是您在第一点比较字符串时使用的数字。

如果未找到任何数字(不匹配),或找到相同的数字,请将字符串比较为文本...