将字符串拆分为单词基于长度的列表c#

时间:2012-07-07 20:19:14

标签: c# string list

我有一串用空格分隔的单词。如何根据单词长度将字符串拆分为单词列表?

示例

  

输入:

" aa aaa aaaa bb bbb bbbb cc ccc cccc cccc bbb bb aa "
     

输出:

List 1 = { aa, bb, cc}
List 2 = { aaa, bbb, ccc}
List 3 = { aaaa, bbbb, cccc}

5 个答案:

答案 0 :(得分:10)

您可以使用Where查找与谓词匹配的元素(在这种情况下,具有正确的长度):

string[] words = input.Split();

List<string> twos = words.Where(s => s.Length == 2).ToList();
List<string> threes = words.Where(s => s.Length == 3).ToList();
List<string> fours = words.Where(s => s.Length == 4).ToList();

或者,您可以使用GroupBy一次查找所有群组:

var groups = words.GroupBy(s => s.Length);

您还可以使用ToLookup,以便您可以轻松索引以查找特定长度的所有字词:

var lookup = words.ToLookup(s => s.Length);
foreach (var word in lookup[3])
{
    Console.WriteLine(word);
}

结果:

aaa
bbb
ccc

查看在线工作:ideone


在您的更新中,您似乎想要删除空字符串和重复的单词。您可以使用StringSplitOptions.RemoveEmptyEntries和后者使用Distinct来完成前者。

var words = input.Split((char[])null, StringSplitOptions.RemoveEmptyEntries)
                 .Distinct();
var lookup = words.ToLookup(s => s.Length);

输出:

aa, bb, cc
aaa, bbb, ccc
aaaa, bbbb, cccc

查看在线工作:ideone

答案 1 :(得分:6)

  

编辑:我很高兴我的原始答案帮助OP解决了他们的问题。然而,在稍微思考一下这个问题之后,我已经适应了它(我强烈建议反对我以前的解决方案,我在帖子的最后留下了这个解决方案。)

一种简单的方法

string input = " aa aaa aaaa bb bbb bbbb cc ccc cccc cccc bbb bb aa ";
var words = input.Trim().Split().Distinct();
var lookup = words.ToLookup(word => word.Length);

说明

首先,我们修剪输入以避免来自外部空间的空元素。然后,我们将字符串拆分为一个数组。如果在单词之间出现多个空格,则需要使用StringSplitOptions,如Mark's answer中所示。

在致电Distinct仅包含每个字一次后,我们现在将wordsIEnumerable<string>转换为Lookup<int, string>,其中'length由密钥{{ 1}}和单词本身存储在值(int)中。

坚持下去,怎么可能呢?我们不是每个键都有多个单词吗?当然,但这正是Lookup课的目的:

  

(string) 表示每个映射到一个或多个的键的集合   值。   Lookup<TKey, TElement>类似于Lookup<TKey, TElement>。不同之处在于   字典将键映射到单个值,而查找映射   将键映射到值集合

     

您可以通过调用对象上的Dictionary<TKey, TValue>来创建Lookup的实例   实现ToLookup

     
     

注意
  没有公共构造函数来创建Lookup的新实例。   此外,Lookup对象是不可变的,也就是说,您无法添加或   在创建后从查找中删除元素或键。

IEnumerable<T> KeySelector lambda:它定义了我们要根据单词的长度索引(或组合,如果你愿意)word => word.Length

用法

将所有单词写入控制台

(类似于问题最初请求的输出)

Lookup

输出

foreach (var grouping in lookup)
{
    Console.WriteLine("{0}: {1}", grouping.Key, string.Join(", ", grouping));
}

将所有具有一定长度的单词放在2: aa, bb, cc 3: aaa, bbb, ccc 4: aaaa, bbbb, cccc

List

按键排序

(请注意,这些将返回List<String> list3 = lookup[3].ToList(); ,因此无法再通过密钥进行访问了)

IOrderedEnumerable<T>

原始答案 - 请不要这样做(性能不佳,代码混乱):

var orderedAscending = lookup.OrderBy(grouping => grouping.Key);
var orderedDescending = lookup.OrderByDescending(grouping => grouping.Key);

答案 2 :(得分:3)

首先,让我们声明一个可以保存长度和单词列表的类

public class WordList
{
    public int WordLength { get; set; }
    public List<string> Words { get; set; }
}

现在,我们可以使用

构建一个单词列表列表
string input = " aa aaa aaaa bb bbb bbbb cc ccc cccc ";
string[] words = input.Trim().Split();
List<WordList> list = words
    .GroupBy(w => w.Length)
    .OrderBy(group => group.Key)
    .Select(group => new WordList { 
        WordLength = group.Key, 
        Words = group.Distinct().OrderBy(s => s).ToList() 
    })
    .ToList();

列表按长度和字母分类排序。


结果

enter image description here

e.g。

list[2].WordLength ==> 4
list[2].Words[1] ==> "bbbb"

更新

如果需要,您可以立即处理结果,而不是将其放入数据结构

string input = " aa aaa aaaa bb bbb bbbb cc ccc cccc ";

var query = input
    .Trim()
    .Split()
    .GroupBy(w => w.Length)
    .OrderBy(group => group.Key);

// Process the result here
foreach (var group in query) {
    // group.Key ==> length of words
    foreach (string word in group.Distinct().OrderBy(w => w)) {
       ...
    }
}

答案 3 :(得分:1)

您可以使用Linq GroupBy

修改 现在我应用Linq生成您想要输出的字符串列表。

<强> EDIT2 在编辑问题中应用多输入,单输出。这只是Linq的一个独特的电话

string input = " aa aaa aaaa bb bbb bbbb cc ccc cccc ";

var list = input.Split(' ');

var grouped = list.GroupBy(s => s.Length);

foreach (var elem in grouped)
{
    string header = "List " + elem.Key + ": ";
    // var line = elem.Aggregate((workingSentence, next) => next + ", " + workingSentence);

    // if you want single items, use this
    var line = elem.Distinct().Aggregate((workingSentence, next) => next + ", " + workingSentence);
    string full = header + " " + line;
    Console.WriteLine(full);
}


// output: please note the last blank in the input string! this generates the 0 list
List 0:  ,
List 2:  cc, bb, aa
List 3:  ccc, bbb, aaa
List 4:  cccc, bbbb, aaaa

答案 4 :(得分:0)

有点冗长的解决方案,但确实将结果输入字典

class Program
    {
        public static void Main()
        {
            Print();
            Console.ReadKey();
        }

        private static void Print()
        {
            GetListOfWordsByLength();

            foreach (var list in WordSortedDictionary)
            {
                list.Value.ForEach(i => { Console.Write(i + ","); });
                Console.WriteLine();
            }
        }

        private static void GetListOfWordsByLength()
        {
            string input = " aa aaa aaaa bb bbb bbbb cc ccc cccc ";

            string[] inputSplitted = input.Split(' ');

            inputSplitted.ToList().ForEach(AddToList);
        }

        static readonly SortedDictionary<int, List<string>> WordSortedDictionary = new SortedDictionary<int, List<string>>();

        private static void AddToList(string s)
        {
            if (s.Length > 0)
            {
                if (WordSortedDictionary.ContainsKey(s.Length))
                {
                    List<string> list = WordSortedDictionary[s.Length];
                    list.Add(s);
                }
                else
                {
                    WordSortedDictionary.Add(s.Length, new List<string> {s});
                }
            }
        }
    }