/ [\ s \ W]#(\ w +)/ g
这是一个非常简单的,仍能正确捕获大多数所需的tweeter主题标签情况, EXCEPT 用于特殊情况,其中主题标签实际上是第一个没有前导字符的单词:
如果我们将第一个字符集设为 lazy ,它将正确捕获第一个#标签,但也会错误地拒绝使用带有前导字母数字字符的主题标签
编程解决方法可以简单地说:"总是在推文字符串的开头添加一个空格",从而绕过这个简单表达式的限制,但现在我真的很好奇看看如何以正确的方式做到这一点。
干杯
答案 0 :(得分:0)
/[\s\W]*#(\w+)/g
这应该允许不需要前面的字符,但可能不是最美妙的方式。