从列表项中删除分号

时间:2013-02-08 12:09:04

标签: c# generic-list

我有一个包含各种字符串记录的列表。一些记录由分号分隔的各种子记录组成。例如如下

  

生活技能

     

没有相关主题

     

通信

     

职业;听力技巧;个人发展;提问技巧;教练/辅导;    承认;招聘和选拔。

     

客户服务

     

体育

我现在要做的是遍历记录,分隔包含分号的所有记录确保没有重复

for(int i=0; i<lst.Count; i++) {
    // seperate the records that contains ';' into individual unique items
}

我该怎么做?

3 个答案:

答案 0 :(得分:3)

        List<String> lst = new List<string>();
        lst.Add("Life Skills");
        lst.Add("Life Skills");
        lst.Add("Communication");
        lst.Add("Careers; Listening Skills;Life Skills; Personal Development; Questioning Skills; Coaching/Mentoring; Recognition; Recruitment and Selection.");
        lst.Add("No Related Topics");

        List<string> newList = new List<string>();

        foreach (string str in lst)
        {
            var temp = str.Split(';');
            if (temp.Length > 1)
            {
                for (int i = 0; i < temp.Length; i++)
                {
                    if (!newList.Contains(temp[i]))
                    {
                        newList.Add(temp[i]);
                    }
                }
            }
            else
            {
                if (!newList.Contains(str))
                {
                    newList.Add(str);
                }
            }
        }

答案 1 :(得分:1)

您可以使用Linq来实现它

lst = lst
  .SelectMany(i => string.Split(";", i))
  .Select(i => i.Trim())
  .Distinct()
  .ToList();

答案 2 :(得分:0)

您想为您的程序实现某种解析器。 StackOverflow不会为您编写程序,但我建议查看http://boost-spirit.com/home/

如果您选择自己滚动,可能出于许可原因,加载文本输入,也许将结果加载到缓冲区直到达到分号,然后将缓冲区复制到字符串并将其推入阵列将是理想的。从那里你可以继续循环,直到你到达文件的末尾。