我想在输入短语中提取所有双引号短语,并将非匹配元素保留为单词
让我说我有“销售人员”IT我希望输出为:
sales people
IT
输入相同的东西=“SO”销售经理\“营销\”管理\“”
输出是:
SO
sales manager
marketing
management
如果输入=“SO”销售经理“营销管理”保险“
输出是:
SO
sales manager
marketing
management
insurance
我找到了正则表达式:但我不知道如何提取:
string InputText="SO \"sales manager\" marketing \"management\"" ;
string pattern0 = "^\"(.*?)\"$";
string pattern = "^(.*?)\"(.*?)\"(.*?)$";
Regex regex = new Regex(pattern);
string[] temOperands;
bool isMatch = regex.IsMatch(InputText);
if (isMatch)
{
//here goes the extraction
}
答案 0 :(得分:3)
我认为你需要像"(?<word>[^"]+)"|(?<word>\w+)
这样的东西。这将匹配双引号和单个单词中的文本:
var str = @"SO ""sales manager"" marketing hello ""management""";
var regex = new Regex(@"""(?<word>[^""]+)""|(?<word>\w+)");
var words = regex.Matches(str)
.Cast<Match>()
.Select(m => m.Groups["word"].Value)
.ToArray();
对于测试字符串,这将返回:
SO
sales manager
marketing
hello
management
答案 1 :(得分:0)
输入字符串在双引号“Sales manager”和“marketing”中只有两个单词。下面的代码可以在双引号内提取字符串。
ArrayList arr = new ArrayList();
int x1 ;
int nextPos=0;
x1 = InputText.IndexOf('\"', 0) +1 ;
while (x1 != -1)
{
if (x1 >= 0)
{
nextPos = InputText.IndexOf('\"',x1);
arr.Add(InputText.Substring(x1, nextPos - x1));
}
nextPos++;
x1 = InputText.IndexOf('\"', nextPos) + 1;
}
答案 2 :(得分:-1)
您可以使用'替换'
string InputText="SO \"sales manager\" marketing \"management\"" ;
InputText=InputText.Replace("\"","\n");
在输出中你会得到你想要的东西。
答案 3 :(得分:-1)
你也可以使用分割功能
string s="SO \"sales manager\" marketing \"management\"";
string[] ExtractedString= Regex.Split(s, "\"");