我正在Node.js中编写一个应用程序,允许用户在Twitter上的消息中互相提及。我希望能够找到用户并向他们发送通知。为了做到这一点,我需要拉@usernames从node.js中的字符串中查找提及?
任何建议,正则表达式,问题?
答案 0 :(得分:36)
我发现这是在javascript中查找字符串内部提及的最佳方法。
var str = "@jpotts18 what is up man? Are you hanging out with @kyle_clegg";
var pattern = /\B@[a-z0-9_-]+/gi;
str.match(pattern);
["@jpotts18", "@kyle_clegg"]
我故意将其限制为大写和小写字母数字和( - ,_)符号,以避免可能与用户名混淆的句点,如(@ j.potts)。
这就是twitter-text.js在幕后所做的事情。
// Mention related regex collection
twttr.txt.regexen.validMentionPrecedingChars = /(?:^|[^a-zA-Z0-9_!#$%&*@@]|RT:?)/;
twttr.txt.regexen.atSigns = /[@@]/;
twttr.txt.regexen.validMentionOrList = regexSupplant(
'(#{validMentionPrecedingChars})' + // $1: Preceding character
'(#{atSigns})' + // $2: At mark
'([a-zA-Z0-9_]{1,20})' + // $3: Screen name
'(\/[a-zA-Z][a-zA-Z0-9_\-]{0,24})?' // $4: List (optional)
, 'g');
twttr.txt.regexen.endMentionMatch = regexSupplant(/^(?:#{atSigns}|[#{latinAccentChars}]|:\/\/)/);
如果您使用了更高效或更准确的任何内容,请与我们联系。谢谢!
答案 1 :(得分:3)
Twitter有一个你应该可以使用的库。 https://github.com/twitter/twitter-text-js
我没有使用它,但如果你相信它的描述,“该库提供了URL,用户名,列表和主题标签的自动链接和提取。”您应该可以在节点中使用npm install twitter-text
。
虽然我知道你不是在寻找Twitter用户名,但是同样的逻辑仍然适用,你应该可以正常使用它(它不会验证提取的用户名是有效的Twitter用户名)。如果没有,为自己的目的分叉可能是一个非常好的起点。
编辑:我仔细查看了文档,并且有一个完美的例子,说明你需要什么here。
var usernames = twttr.txt.extractMentions("Mentioning @twitter and @jack")
// usernames == ["twitter", "jack"]