在BigQuery中的正则表达式之前提取字符串

时间:2016-11-28 20:15:04

标签: regex google-bigquery

我是regex的新手。我试图从长URL中提取网站名称,如下所示。

http://connect.themediatrust.com/d/?a=19481782541

我试图在“.com”部分之前获取所有内容。

选择   顾客ID,   COALESCE(REGEXP_EXTRACT(referrer_uri,r'([^(。+?)“。com”])'),referrer_uri)AS referrer_uri 从   [zz_marketing_analytics.visit_from_zumobi] 哪里   referrer_uri = “http://connect.themediatrust.com/d/?a=19481782541”;

我只获得“h”作为引用URI。我不确定是什么问题。

1 个答案:

答案 0 :(得分:2)

  

我试图在“.com”部分之前获取所有内容。

请尝试以下

开头
SELECT 
  REGEXP_EXTRACT(referrer_uri, r'(.*).com') AS referrer_uri,
  DOMAIN(referrer_uri), 
  HOST(referrer_uri)
FROM (SELECT "http://connect.themediatrust.com/d/?a=19481782541" AS referrer_uri)