正则表达式获取双引号中的短语

时间:2012-05-06 05:45:16

标签: java regex text

我需要帮助来构建正则表达式。我正在编写一个查找字符串中某些单词的软件。但我还需要寻找短语。该字符串由用户在文本框中输入。

目前我使用以下正则表达式\s+来替换&符号的空格: word1 word2 word3word1&word2&word3

我的新要求必须包含用引号括起来的短语,例如在Google中搜索短语。

"word1 word2" "word3 word4" word5

必须:

word1 word2&word3 word4&word5

提前致谢。

编辑:如果有其他方式或其他方法可以做同样的事情,我会接受任何想法。

1 个答案:

答案 0 :(得分:5)

这假设任务很平衡 - 你有任意数量的任务,而不是任务中间的任务。

您可以匹配/"([^"]+)"|(\S+)/ - 这将导致您的文字 - 引用字符串或非空格。它捕获了第1组 2中的单词,然后您可以使用join分隔符&结果。

另一个选择:你可以通过跳过你的标记,在一个替换中获得它,这与第一个模式非常相似。这是一个JavaScript示例:

s = s.replace(/(?:"([^"]+)"|(\S+))\s*/g, '$1$2&');

(请注意,在字符串的末尾会有额外的&符号)