正则表达式查找可能包含空格的字符串

时间:2017-05-27 08:01:02

标签: python regex

我有一个表格的字符串:

absdaskk adknksadn daksnksa > words words words >

我希望有一种模式可以让我回答单词''。我确定我可以使用正则表达式执行此操作,我尝试使用:

"&gt [A-Za-z\s] &gt"

但是这没有给我任何结果,我很确定问题出在空白上,我认为这些空白由\s表示,但可能不是......

注意:我可能不会使用像split这样的东西,因为完整的字符串可能包含更多& gt部分,这是不可预测的。

2 个答案:

答案 0 :(得分:1)

你忘记了;。此外,您需要输入+以确保匹配多个字符。

> [A-Za-z\s]+ >

答案 1 :(得分:0)

要查找空格,您可以使用\s以及字面上的空格,两者都可以正常工作,因此代码中没有空格问题。

问题是[A-Za-z\s]仅指1个字符,可以是A-Za-z\s,但我们需要引用零或更多。所以我们需要*之后这样:

[A-Za-z\s]*

另外,你在&gt之后忘记了一个分号。请注意,如果您指的是>之间的内容,那么要获取它们,您需要捕获组。

>([A-Za-z\s]*)>