我有一个包含各种字符串记录的列表。一些记录由分号分隔的各种子记录组成。例如如下
生活技能
没有相关主题
通信
职业;听力技巧;个人发展;提问技巧;教练/辅导; 承认;招聘和选拔。
客户服务
体育
我现在要做的是遍历记录,分隔包含分号的所有记录和确保没有重复。
for(int i=0; i<lst.Count; i++) {
// seperate the records that contains ';' into individual unique items
}
我该怎么做?
答案 0 :(得分:3)
List<String> lst = new List<string>();
lst.Add("Life Skills");
lst.Add("Life Skills");
lst.Add("Communication");
lst.Add("Careers; Listening Skills;Life Skills; Personal Development; Questioning Skills; Coaching/Mentoring; Recognition; Recruitment and Selection.");
lst.Add("No Related Topics");
List<string> newList = new List<string>();
foreach (string str in lst)
{
var temp = str.Split(';');
if (temp.Length > 1)
{
for (int i = 0; i < temp.Length; i++)
{
if (!newList.Contains(temp[i]))
{
newList.Add(temp[i]);
}
}
}
else
{
if (!newList.Contains(str))
{
newList.Add(str);
}
}
}
答案 1 :(得分:1)
您可以使用Linq来实现它
lst = lst
.SelectMany(i => string.Split(";", i))
.Select(i => i.Trim())
.Distinct()
.ToList();
答案 2 :(得分:0)
您想为您的程序实现某种解析器。 StackOverflow不会为您编写程序,但我建议查看http://boost-spirit.com/home/
如果您选择自己滚动,可能出于许可原因,加载文本输入,也许将结果加载到缓冲区直到达到分号,然后将缓冲区复制到字符串并将其推入阵列将是理想的。从那里你可以继续循环,直到你到达文件的末尾。