Hadoop生态系统中的实时数据库

时间:2014-09-08 10:07:05

标签: hadoop hbase thrift cloudera-manager

如果这是一个愚蠢的问题,请原谅我。

我在单个节点中安装了cloudera管理器。

我正在尝试使用Hbase和Hadoop在我的Web应用程序中记录请求和响应。

我正在尝试使用日志列出最新的用户活动。

使用下表结构添加行。

1列系列,RowId,11列。我将每个值存储为字符串。相当简单&类似于mysql表。

RowId
entry:addedTime
entry:value
entry:ip
entry:accessToken
entry:identifier
entry:userId
entry:productId
entry:object
entry:requestHeader
entry:completeDate
entry:tag

现在,为了从我的Hbase获取行,我使用

SingleColumnValueFilter("entry", "userId", "=", binary:"25", true, true)

现在,我正在努力通过

来订购

entry:completeDate DESCENDING

并限制25行进行分页或无限滚动。

我的问题,

Hbase是否是Hadoop生态系统中唯一可用的实时查询数据库?

我是否因错误的原因使用Hbase?我的桌子结构是否正确?

我在创业公司工作,这是我们迈向BigData的宝贝步骤。虽然BigData创造了很多炒作,但Hadoop对最新的Linux支持不足,看起来太复杂了。

任何帮助或建议都将不胜感激。

非常感谢,

KARTHIK

0 个答案:

没有答案