如何在javascript中拉出像twitter这样的字符串

时间:2013-03-07 07:39:20

标签: javascript regex node.js twitter

我正在Node.js中编写一个应用程序,允许用户在Twitter上的消息中互相提及。我希望能够找到用户并向他们发送通知。为了做到这一点,我需要拉@usernames从node.js中的字符串中查找提及?

任何建议,正则表达式,问题?

2 个答案:

答案 0 :(得分:36)

我发现这是在javascript中查找字符串内部提及的最佳方法。

var str = "@jpotts18 what is up man? Are you hanging out with @kyle_clegg";
var pattern = /\B@[a-z0-9_-]+/gi;
str.match(pattern);
["@jpotts18", "@kyle_clegg"]

我故意将其限制为大写和小写字母数字和( - ,_)符号,以避免可能与用户名混淆的句点,如(@ j.potts)。

这就是twitter-text.js在幕后所做的事情。

// Mention related regex collection
twttr.txt.regexen.validMentionPrecedingChars = /(?:^|[^a-zA-Z0-9_!#$%&*@@]|RT:?)/;
twttr.txt.regexen.atSigns = /[@@]/;
twttr.txt.regexen.validMentionOrList = regexSupplant(
    '(#{validMentionPrecedingChars})' +  // $1: Preceding character
    '(#{atSigns})' +                     // $2: At mark
    '([a-zA-Z0-9_]{1,20})' +             // $3: Screen name
    '(\/[a-zA-Z][a-zA-Z0-9_\-]{0,24})?'  // $4: List (optional)
  , 'g');
twttr.txt.regexen.endMentionMatch = regexSupplant(/^(?:#{atSigns}|[#{latinAccentChars}]|:\/\/)/);

如果您使用了更高效或更准确的任何内容,请与我们联系。谢谢!

答案 1 :(得分:3)

Twitter有一个你应该可以使用的库。 https://github.com/twitter/twitter-text-js

我没有使用它,但如果你相信它的描述,“该库提供了URL,用户名,列表和主题标签的自动链接和提取。”您应该可以在节点中使用npm install twitter-text

虽然我知道你不是在寻找Twitter用户名,但是同样的逻辑仍然适用,你应该可以正常使用它(它不会验证提取的用户名是有效的Twitter用户名)。如果没有,为自己的目的分叉可能是一个非常好的起点。

编辑:我仔细查看了文档,并且有一个完美的例子,说明你需要什么here

var usernames = twttr.txt.extractMentions("Mentioning @twitter and @jack")
// usernames == ["twitter", "jack"]