HBase - 列族

时间:2011-04-23 07:15:18

标签: hbase

我是HBase的初学者。 我需要设计我的桌子。 我想玩以下信息:

在XX-XX-XXXX日期,'HELLO'一词在文件2,3,4中,每个文件的权重为12,45,36 - 我的原始数据:doc:D title:'我喜欢土豆',重量:W,日期:D

我创建了一个表,其中:row:word,column:date,value:doc 但我不能存储具有相同日期的多行。

我们可以为表创建多个列族吗? 什么是设计模式的最佳方法?

非常感谢

1 个答案:

答案 0 :(得分:0)

日期是文档最相关的信息位吗?正如您所说,您只能使用给定的架构在每个日期存储一个文档。另一种方法是制作复合键,例如:DATE_TIME_DOCUMENT-ID。文档ID可以是内容的sha1以确保唯一性。而且,如果您希望最近的文档易于检索,您还可以反转DATE-TIME度量(例如Long.MAX_VALUE - 文档时间戳)。如果你不关心日期,那么文件就可以单独存储在他们的身份证上。