如何使用正则表达式提取网站的确切名称?

时间:2018-01-17 17:42:05

标签: regex go

这是为了提取任何com或org的网站,其中www。是可选的。 这会使http://成为必须,而且我也无法理解[^。] +的含义。

  ^http://(?:www\.)?[^.]+\.(com|org)/.*$

我想要一个特定的网站,即:

  ^http://(?:www\.)?yahoo+\.(com|org)/.*$

感谢

1 个答案:

答案 0 :(得分:2)

请使用“net / url”包。它具有Hostname()方法,允许您从任何URL中提取主机的名称。

在您的情况下,[^.]表示除点之外的任何符号。括号定义符号类。加上之后表示此课程后的一个或多个符号。 您可以修改正则表达式(这将匹配从yahoo开始的所有域):

^http://(?:www\.)?yahoo[^.]+\.(com|org)/.*$