BigQuery拆分列并获取每个子字符串的计数

时间:2018-03-06 23:58:57

标签: sql google-bigquery

在BigQuery中,我想创建一个查询来计算注释字段中单词的出现次数,并按每次出现次数计数。这样我就可以了解哪些单词比其他单词更常用,并了解用户行为和情绪。对于bigquery来说很新,所以任何想法都会有所帮助。

1 个答案:

答案 0 :(得分:0)

我最终做的是使用拆分功能......

SELECT 
COUNT(JJ) AS STUFF, JJ
FROM
(SELECT SPLIT(text, ' ') AS JJ FROM [bigquery-public-
data:hacker_news.comments] LIMIT 1000 ) 
GROUP BY JJ
ORDER BY STUFF DESC
LIMIT 5

显然,在拆分之前使用replace来删除其他字符可以更多地操作它。