我正在试图找出解决数据问题的方法。基本上,我们:
- 以每个用户为基础的事件数据流入我们的系统
- 但我们希望能够将多个用户聚合在一起,因为很明显他们是同一个人(因此我们建议将事件数据存储在hbase中,以便我们可以删除和更新行)
- 数据采用json文件的形式
- 我们希望能够对数据运行类似sql的查询,例如,检索其json文档具有' page-visited'的所有行。以及'主页'的值。换句话说,我们希望能够构建查看json文档的各个键和值的查询。
我想弄清楚是否有可能:
- 将此数据存储在hbase中(我认为应该可以/容易)
- 以某种方式用凤凰查询它(只是刚开始看凤凰,但似乎有可能定义一个类型&#39; json&#39;并且可能它有一些json函数 - 尽管我<还没有找到)
感谢您的帮助。