如何计算重复字段中的搭配

时间:2012-12-07 03:42:59

标签: google-bigquery

我有一个包含字符串列表的重复字段A.什么是找到与给定字符串重合的TOP字符串的好方法。因此,如果A持有主题标签,对于给定的标签#T1,找到与最高记录数中的#T1重合的标签。

1 个答案:

答案 0 :(得分:1)

您可以使用WITHINSUM(IF(...))查找匹配项。例如:

SELECT hashtag, COUNT(*) AS cnt
    (SELECT tweet.hashtag as hashtag, 
            SUM(IF(tweet.hashtag == '#T1', 1, 0)) WITHIN RECORD as tagz
     FROM [tweets]) 
WHERE tagz  > 0
GROUP by hashtag,
ORDER BY cnt DESC