主题标签的正则表达式打印出每个字母

时间:2013-08-28 11:51:30

标签: python regex django string

我想找到推文中的所有主题标签。下面的代码找到了主题标签,但是当打印出来时,每个字母都被写出而不是实际的标签。

问题是我想为找到的主题标签创建链接,这是现在不可能的,因为它应该为主题标签中的每个字母创建链接。

我做错了什么?

tag_regex = re.compile(r"""
       [/^#\S+$/]
       """, re.VERBOSE)

for tag in tag_regex.findall(tweet):
    print tag

结果:

#
h
a
s
h
t
a
g
1
#
h
a
s
h
t
a
g
2

1 个答案:

答案 0 :(得分:3)

括号构成您不想要的character class。此外,您不希望在不使用它们的语言中使用正则表达式分隔符/.../(简单的字符串就足够了,最好是原始字符串,因此您不需要转义反斜杠)。最后,如果要查找输入字符串的子字符串,则不应使用anchors

tag_regex = re.compile(r"#\S+")