德鲁伊-查找

时间:2018-11-29 12:24:48

标签: apache-kafka druid

我在德鲁伊中创建查找时遇到麻烦。我想使用csv创建查找,主要问题是将多个URL映射到一个“组”,例如:

csv文件内容:

Tag

我想创建返回类似以下内容的响应的查询:

page.href, hrefsGroup
https://google.com, search
https://yahoo.com, search
https://medium.com, informations
https://wikipedia, informations

仅供参考:[ { value: 'search', pv: '2354321' }, { value: 'informations', pv: '82183123' } ] 是指标pv

有人可以帮助我吗?

1 个答案:

答案 0 :(得分:0)

您可以使用简单的TopN查询-

{"queryType":"topN","dataSource":"wikiticker","intervals":["2016-06-27/2016-06-28"],"granularity":"all","dimension":"hrefsGroup","metric":"pv","threshold":25,"aggregations":[{"type":"longSum","name":"pv","fieldName":"count"}]}

它将列出前25个hrefsGroup以及综合浏览量。