正则表达式:当它是推文的第一个字符时捕获主题标签

时间:2017-10-30 21:37:35

标签: twitter hashtag

/ [\ s \ W]#(\ w +)/ g

这是一个非常简单的,仍能正确捕获大多数所需的tweeter主题标签情况, EXCEPT 用于特殊情况,其中主题标签实际上是第一个没有前导字符的单词:

enter image description here

http://regexr.com/3h2rr

如果我们将第一个字符集设为 lazy ,它将正确捕获第一个#标签,但也会错误地拒绝使用带有前导字母数字字符的主题标签

enter image description here

http://regexr.com/3h2ru

编程解决方法可以简单地说:"总是在推文字符串的开头添加一个空格",从而绕过这个简单表达式的限制,但现在我真的很好奇看看如何以正确的方式做到这一点。

干杯

1 个答案:

答案 0 :(得分:0)

/[\s\W]*#(\w+)/g

这应该允许不需要前面的字符,但可能不是最美妙的方式。