提取短语中的双引号项

时间:2012-04-09 12:19:25

标签: c# regex string split

我想在输入短语中提取所有双引号短语,并将非匹配元素保留为单词

让我说我有“销售人员”IT我希望输出为:

sales people

  IT
输入相同的东西=“SO”销售经理\“营销\”管理\“”

输出是:

SO
sales manager
marketing
management

如果输入=“SO”销售经理“营销管理”保险“

输出是:

SO
sales manager
marketing
management
insurance

我找到了正则表达式:但我不知道如何提取:

string InputText="SO \"sales manager\" marketing \"management\"" ;
string pattern0 = "^\"(.*?)\"$";
string pattern = "^(.*?)\"(.*?)\"(.*?)$";
Regex regex = new Regex(pattern);
string[] temOperands;
bool isMatch = regex.IsMatch(InputText);
if (isMatch)
{
    //here goes the extraction
}

4 个答案:

答案 0 :(得分:3)

我认为你需要像"(?<word>[^"]+)"|(?<word>\w+)这样的东西。这将匹配双引号和单个单词中的文本:

var str = @"SO ""sales manager"" marketing hello ""management""";
var regex = new Regex(@"""(?<word>[^""]+)""|(?<word>\w+)");
var words = regex.Matches(str)
    .Cast<Match>()
    .Select(m => m.Groups["word"].Value)
    .ToArray();

对于测试字符串,这将返回:

SO
sales manager
marketing
hello
management

答案 1 :(得分:0)

输入字符串在双引号“Sales manager”和“marketing”中只有两个单词。下面的代码可以在双引号内提取字符串。

        ArrayList arr = new ArrayList();

        int x1 ;
        int nextPos=0;
        x1 = InputText.IndexOf('\"', 0) +1 ;
        while (x1 != -1)
        {
            if (x1 >= 0)
            { 
                nextPos = InputText.IndexOf('\"',x1);
                arr.Add(InputText.Substring(x1, nextPos - x1));
            }
            nextPos++;
            x1 = InputText.IndexOf('\"', nextPos) + 1;
        }

答案 2 :(得分:-1)

您可以使用'替换'

string InputText="SO \"sales manager\" marketing \"management\"" ;
InputText=InputText.Replace("\"","\n");

在输出中你会得到你想要的东西。

答案 3 :(得分:-1)

你也可以使用分割功能

string s="SO \"sales manager\" marketing \"management\"";
string[] ExtractedString= Regex.Split(s, "\"");