Question

如果这是一个愚蠢的问题，请原谅我。

我在单个节点中安装了cloudera管理器。

我正在尝试使用Hbase和Hadoop在我的Web应用程序中记录请求和响应。

我正在尝试使用日志列出最新的用户活动。

使用下表结构添加行。

1列系列，RowId，11列。我将每个值存储为字符串。相当简单＆amp;类似于mysql表。

RowId
entry:addedTime
entry:value
entry:ip
entry:accessToken
entry:identifier
entry:userId
entry:productId
entry:object
entry:requestHeader
entry:completeDate
entry:tag

现在，为了从我的Hbase获取行，我使用

SingleColumnValueFilter("entry", "userId", "=", binary:"25", true, true)

现在，我正在努力通过

来订购

entry:completeDate DESCENDING

并限制25行进行分页或无限滚动。

我的问题，

Hbase是否是Hadoop生态系统中唯一可用的实时查询数据库？

我是否因错误的原因使用Hbase？我的桌子结构是否正确？

我在创业公司工作，这是我们迈向BigData的宝贝步骤。虽然BigData创造了很多炒作，但Hadoop对最新的Linux支持不足，看起来太复杂了。

任何帮助或建议都将不胜感激。

非常感谢，

KARTHIK

Hadoop生态系统中的实时数据库

0 个答案: