Question

我想从以下内容中提取所有的twitter句柄：http://twitaholic.com/top100/followers/

所有Twitter句柄均以@

开头

像wget twitaholic.com/top100/followers/ | grep -oh "@"之类的东西只能打印句柄，但这不起作用（只打印@）。怎么了？

Answer 1

您正在使用-o的{{1}}选项并且仅指定一个字符grep，您也不需要@选项。

试试这个：

-h

我们在这里wget twitaholic.com/top100/followers/ | grep -o "@[^<]*"所说的是查找grep符号并捕获所有内容，直到看到@符号为止。这是因为带有句柄的行看起来像这样：

因此，您实际需要提取从;@BarackObama<br到@的文字。

<强>输出：