我有一个IEnumerable<sentence>
(句子=字符串)
我想将所有句子分成单词(例如:.Select(t => t.Split(' ')
),之后我需要按单词对此查询进行分组,以获得唯一单词列表。
请,帮助
答案 0 :(得分:13)
首先猜测:
var uniqueWords = sentences.SelectMany(s => s.Split(' ')).Distinct();
但是,您可能希望删除标点符号并转到小写;您可以通过将更多字符传递给Split并要求它删除空字符串,然后在结果上调用ToLowerInvariant
来完成此操作。
如果输入的句子来自SQL,它将是IQueryable
而不是IEnumerable
,因此Linq将尝试在数据库中执行查询,这限制了您可以执行的操作。
要使Linq在内存中执行,为您提供BCL的全部功能,请使用:
var uniqueWords = sentences.AsEnumerable().SelectMany(s => s.Split(' ')).Distinct();
对AsEnumerable()
的额外调用会将数据库的原始结果存入内存,因此您可以正常进行。