从文本中删除由不同符号组成的单词

时间:2016-11-29 15:14:31

标签: c#

嘿伙计们我刚刚来到这里,我需要让我的程序删除txt文件中由不同符号组成的所有单词。我甚至不知道从哪里开始。 PS。 对不起我的英语不好。 :)

<iframe>

这是我之前做的

澄清OP的要求:他希望从字符串中删除具有相同字符2次或更多次的单词。例如,应该删除“test”,因为它有2个。

2 个答案:

答案 0 :(得分:0)

这将找到具有重复字符的单词并将其从字符串中删除:

var input = "OK WORDS: \"box, super, list, word\", BAD WORDS: \"mom, test, accept, less\"?";
var regex = new Regex(@"\b[\w\d]*([\w\d])[\w\d]*\1[\w\d]*\b");
var output = regex.Replace(input, string.Empty);

答案 1 :(得分:0)

根据您的需要调整此选项,输出包含所有不同的字符单词:

const string test =
"this is a test text consisting of various words where some consist of unique characters only while others have duplicates in them.";

var words = test.Split(' ');
var output=new List<string>();
foreach (var word in words)
{
    if (word.Distinct().Count() == word.Length) // word contains distinct characters only
    {
        output.Add(word);
    }
}
Debug.Print(string.Join(" ",output));