我需要一个与Twitter用户名匹配的正则表达式。
所以我想抓取页面的HTML来获取所有有效的Twitter用户名。 因此,不应该返回电子邮件,也不会返回无效的用户名,因为我知道Twitter用户名中不允许有一些字符。
如果提供了C#示例,则获得奖励。
编辑:
到目前为止我所拥有的是:
Regex regex = new Regex(@"/(?<=^|(?<=[^a-zA-Z0-9-_\.]))@([A-Za-z]+[A-Za-z0-9]+)/i");
string html = GetPageHtml(uri);
Match match = regex.Match(html);
我检查过这个但是工作不正常。另外我得到的信息是twitter库有这个功能,但我找不到它。
我对Regex并不熟悉
答案 0 :(得分:1)
这个正则表达式应该这样做:
/[^\w]@([a-zA-Z0-9_]{1,15})(?:\b)(?![\;\:\-\.\[\]\*\?\!\$\^\+\/\#\"\'\=\(\)\&\@á-ź{-º])/igm
以下是测试:http://regexr.com/3bss5
我在Javascript中对它进行了测试,但我相信你不会有任何问题让它在C#中运行