如何从不规则命名的字符串中提取网站名称?

时间:2016-09-02 20:15:15

标签: sql regex hive hiveql

我有一个看起来像这样的专栏:

this contains no website
this is a web site.io
another websi te.co

我想创建一个如下所示的列:

NULL
site
te

因此,在没有句点的情况下,它应该返回NULL,但是如果有一个句点,它应该返回句点和前一个空格之间的东西。

2 个答案:

答案 0 :(得分:1)

你可以像这样使用积极的前瞻:

\S+(?=\.\S+)

第一个\S+是您想要的,前瞻(?=\.\S+)是后缀(例如.com.org.net等。)< / p>

答案 1 :(得分:0)

你可以去:

\b(\w+)\.(?:io|co)\b

请参阅a demo on regex101.com