用于Twitter用户名的HTML

时间:2015-09-28 23:31:11

标签: c# regex twitter

我需要一个与Twitter用户名匹配的正则表达式。

所以我想抓取页面的HTML来获取所有有效的Twitter用户名。 因此,不应该返回电子邮件,也不会返回无效的用户名,因为我知道Twitter用户名中不允许有一些字符。

如果提供了C#示例,则获得奖励。

编辑:

到目前为止我所拥有的是:

Regex regex = new Regex(@"/(?<=^|(?<=[^a-zA-Z0-9-_\.]))@([A-Za-z]+[A-Za-z0-9]+)/i");
string html = GetPageHtml(uri);
Match match = regex.Match(html);

我检查过这个但是工作不正常。另外我得到的信息是twitter库有这个功能,但我找不到它。

我对Regex并不熟悉

1 个答案:

答案 0 :(得分:1)

这个正则表达式应该这样做:

/[^\w]@([a-zA-Z0-9_]{1,15})(?:\b)(?![\;\:\-\.\[\]\*\?\!\$\^\+\/\#\"\'\=\(\)\&\@á-ź{-º])/igm

以下是测试:http://regexr.com/3bss5

我在Javascript中对它进行了测试,但我相信你不会有任何问题让它在C#中运行