按字典顺序排序字符串数组

时间:2017-12-14 20:52:53

标签: c# arrays string sorting string-comparison

我一直在努力应对挑战,已经研究了几个小时,但仍然无法在C#中按字典顺序“正确”排序字符串数组或字符串列表。

我正在努力的挑战问题:

  • 仅考虑两个字符串的小写字母。
  • 比较它们以找出两个字符串中出现的字符。
  • 比较这些字符,找出哪个原始字符串包含每个字符的最多出现次数。
  • 将结果作为字符串附加格式,该格式描述哪个字符串具有较高的计数“1:”或“2:”或如果等于“=:”,后跟该字符串中由“/”连接的所有字符。
  • 按照长度的递减顺序对结果进行排序,当它们长度相等时,按字母顺序升序对子字符串进行排序。

结果的一个例子是以下是我的输出:

“2:EEEEE / 2:YY / =:HH / =:RR”

“2:EEEEE / 2:YY / =:RR / =:HH”

正确结果的另一个例子是以下是我的输出:

1:OOO / 1:UUU / 2:SSS / =:NNN / 1:II / 2:AA / 2:DD / 2:EE / =:GG

=:NNN / 1:OOO / 1:UUU / 2:SSS / =:GG / 1:II / 2:AA / 2:DD / 2:EE

造成这种情况的代码行是:

strings = strings.OrderByDescending(x => x.Length).ThenBy(c => c).ToArray();

我尝试了不同的方法来解决这个问题,例如将字符串拆分为一定长度的单个字符串数组,执行字典顺序,然后将它们追加到结果中。但是对于许多不同的测试用例,一个会通过而另一个会失败。

我的问题是找出为什么C#看到“=”比数字少,当它真的在ASCII图表上更大时。我运行了一个测试,这就是String.Compare给我的。在Python中,它给了我不同的东西。

这是我的完整代码,随时指出任何错误。我只编程了9个月。我知道这不是最好的解决方案。

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

namespace Rextester
{
    public class Program
    {
        public static void Main(string[] args)
        {
            string s1 = "looping is fun but dangerous";
            string s2 = "less dangerous than coding";

            // Expected
            Console.WriteLine("1:ooo/1:uuu/2:sss/=:nnn/1:ii/2:aa/2:dd/2:ee/=:gg\n");

            // Result
            Console.WriteLine(StringsMix(s1, s2));
        }

        public static string StringsMix(string s1, string s2)
        {
            StringBuilder sb = new StringBuilder();
            // Convert string to char arrays order by ascending
            char[] s1Chars = s1.Where(x => char.IsLower(x)).OrderBy(x => x).ToArray();
            char[] s2Chars = s2.Where(x => char.IsLower(x)).OrderBy(x => x).ToArray();

            // Insert arrays to find characters that appear in both 
            char[] inter = s1Chars.Intersect(s2Chars).ToArray();

            for (int i = 0; i < inter.Length; i++){
                // For each character, put all occurences in their respective array
                // Get count
                char[] s1Ch = s1.Where(x => x.Equals(inter[i])).ToArray();
                char[] s2Ch = s2.Where(x => x.Equals(inter[i])).ToArray();
                int s1Count = s1Ch.Length;
                int s2Count = s2Ch.Length;

                if (s1Count > s2Count)
                {
                    string chars = new String(s1Ch);
                    sb.Append("1:" + chars + "/");
                }
                else if (s2Count > s1Count)
                {
                    string chars = new String(s2Ch);
                    sb.Append("2:" + chars + "/");
                }
                else if (s1Count == s2Count)
                {
                    string chars = new String(s1Ch);
                    sb.Append("=:" + chars + "/");
                }
            }

            string final = String.Empty;
            string[] strings = sb.ToString().Split('/');
            strings = strings.OrderByDescending(x => x.Length).ThenBy(c => c).ToArray(); // "Lexicographical ordering"

            final = String.Join("/", strings);
            strings = final.Split('/').Where(x => x.Length > 3).Select(x => x).ToArray(); // Remove trailing single characters
            final = String.Join("/", strings);
            return final;
        }
    }
}

1 个答案:

答案 0 :(得分:1)

这是因为'=''1''2'之前对进行排序;你希望它在数字之后对进行排序。

您可以通过在中间添加特殊条件来强制执行此订单:

var specialOrder = "12=";
var ordered = data
    .OrderByDescending(s => s.Length)
    .ThenBy(s => specialOrder.IndexOf(s[0])) // <<== Add this
    .ThenBy(s => s);

这将确保首字母按照specialOrder字符串中的字符顺序排序,即'1',然后'2',然后'='

Demo.

注意:该代码假设序列没有空字符串。您的代码确保每个字符串至少包含三个字符,因此不存在问题。