使用\ S而不是\ w

Question

我想用python整理出句子中用's'开头的单词这是我的代码：

import re
text = "I was searching my source to make a big desk yesterday."
m = re.findall(r'[s]\w+', text)
print m

但代码的结果是：

['searching', 'source', 'sk', 'sterday'].

如何编写有关正则表达式的代码？或者，有什么方法可以整理单词吗？

Answer 1

>>> import re
>>> text = "I was searching my source to make a big desk yesterday."
>>> re.findall(r'\bs\w+', text)
['searching', 'source']

对于小写和大写s，请使用：r'\b[sS]\w+'

Answer 2

我知道它不是正则表达式解决方案，但您可以使用startswith

>>> text="I was searching my source to make a big desk yesterday."
>>> [ t for t in text.split() if t.startswith('s') ]
['searching', 'source']
>>>

Answer 3

解决方案是：

\bs\w+

此正则表达式将匹配s之前没有单词字符（也适用于字符串的开头），并且后面至少需要一个单词字符。 \w+匹配它可以找到的所有单词字符，因此最后不需要\b。

Answer 4

我尝试了这个代码示例，我认为它完全符合您的要求：

import re
text = "I was searching my source to make a big desk yesterday."
m = re.findall (r'\b[s]\w+', text)
print (m)

Answer 5

Lambda样式：

text = 'I was searching my source to make a big desk yesterday.'

list(filter(lambda word: word[0]=='s', text.split()))

输出：

['searching', 'source']

Answer 6

我想在这里添加一件小事，

让我们说你有一条线来找到以＆＃39;

开头的单词

line =＆＃34;有人应该向some@gmail.com"

展示一些东西

如果你写正则表达式，如，剑= re.findall（r＆＃34; \ b [sS] \ w +＆＃34;，line）

输出将是， [＆＃39;有人＆＃39;，＆＃39;应该＆＃39;＆＃39;显示＆＃39;＆＃39;东西＆＃39;＆＃39;一些＆＃39;]

但是如果你将正则表达式修改为，

剑= re.findall（r＆＃34; \ b [sS] \ S +＆＃34;，line）

输出将是， [＆＃39;人＆＃39;＆＃39;应该＆＃39;＆＃39;秀＆＃39;＆＃39;什么＆＃39;＆＃39; some@gmail.com']